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Gene humain htfUIA et la proteine codee hTFIIIA 

La present e invention concerne le gene codant pour le 
facteur de transcription humain nomine ci-apres gene htfUIA 
5 (ou htfC2) et la proteine cod£e hTFIIIA ainsi que 1' utilisa- 
tion de ce gene htfUIA et celui de la proteine codee hTFIIIA 
dans le diagnostic et 1 ' identification de certaines maladies 
liees au mecanisme de la transcription. 

Nous appellerons ci-apres tfHIA (ou tfC2) le gene 
10 codant pour le facteur de transcription TFIIIA et htfUIA le 
gene codant pour le facteur de transcription humain hTFIIIA. 
Le gene humain htfUIA code done pour la proteine correspon- 

dante hTFIIIA. 

Nous utiliserons egalement ci-apres les abreviations 
15 suivantes : AA pour acides amines, AN pour acides nucleiques, 
pb pour paires de bases, ADN pour acide desoxyribonucleique , 
ADNc pour ADN complementaire , ARN pour acide ribonucleique et 
RNase pour ribonuclease et C pour desoxycytidine. 

On utilisera egalement le terme screening qui designe 
20 une technique de criblage specifique et le terme primer qui 
designe un oligonucleotide utilise en amorce. 

Le gene tfHIA et la proteine correspondante TFIIIA seraient 
impliques dans la regulation du mecanisme biologique de la 
transcription comme indique ci-apres. 

25 Depuis que la proteine TFIIIA a ete purifiee comme 

facteur de transcription pour la premiere fois en 1980 a 
partir d'ovocytes de Xenope [Segall et Al , J. Biol. Chem. , . 
255, 11986-11991 (1980)], des travaux ont ete menes in vivo 
et in vitro dans le Xenope pour etudier le mecanisme de 

30 controle de la transcription exerce par TFIIIA. On a ainsi 

montre que TFIIIA de Xenope est necessaire pour 1' initiation 
de la transcription du gene ARN 5S [Sakonji et al , Cell 19, 
13-25 (1980)] et se lie a une region de controle interne du 
gene ARN 5S [Bogenhagen et al , Cell, 19,27-35 (1980)]. 

35 La sequence en nucleotides de l'ADNc de tfHIA de Xenope 

et la sequence correspondante d' acides amines ont deja ete 
publiees [Ginberg et al , Cell 39,479-489 (1984)]. On peut 
noter que ce gene code pour une structure en 9 doigts de 
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zinc, un doigt de zinc correspondant a la repetition du motif 
CYS2 HIS2 (C2H2) . Cette structure en doigt de zinc est 
consideree comme un domaine essentiel pour un groupe de 
proteines qui se lient a 1 *ADN (DNA binding proteins) [Miller 
5 et al, Embo J., 4, 1607-1614 (1985)]. 

On connait ainsi dans l'etre humain des facteurs de 
transcription se liant a l'ADN qui possedent egalement cette 
structure en doigt de zinc tels que par exemple XT1 du gene 
de la tumeur humaine de Wilms, [Gessier et al, Nature, 343 f 

10 774-778 (1990)], le represseur humain de transcription YY1 
[SHI et al, Cell, 67, 377-388 (1991)], la proteine MAZ 
associee au gene humain MYC [Bossone et al , Proc . Natl. Acad. 
Sci . , USA, iL2., 7452-7456 (1992)] ou encore spl [Kuwahara et 
al, J.Biol. Chem. , 2B., 8627-8631 (1990)]. 

15 Des travaux ont ete effectues afin d'isoler le gene 

humain htfUIA, mais aucun jusqu'ici n'a abouti a mettre en 
evidence la veritable sequence du gene htfUIA. 

On peut citer ainsi d'une part les travaux decrits dans 
la demande europeenne EP 0704526 (Fujisawa et al) , et repris 

20 dans Particle : Arakawa et al (1995), Cytogenet Cell Genet 
iQ, 235-238, qui ont abouti a. une sequence que nous appelle- 
rons htfUIA de Arakawa et d' autre part les travaux decrits 
dans l'article : DREW et al (1995), Gene 159,215-218, qui ont 
abouti a une sequence que nous appellerons htfUIA de DREW. 

2 5 Ces sequences htfUIA de DREW et de ARAKAWA sont representees 

respect ivement aux figures 4 et 5 ci-apres. 

Les documents indiques ci-dessus decrivent done chacun une 
sequence du gene htfUIA mais ces deux sequences different 
1 1 une de 1' autre par quelques nucleotides et different du 

3 0 gene htfUIA de la present e demande comme indique ci-apres. 

La presente invention a permis d'isoler le gene codant 
pour le facteur de transcription humain hTFIIIA. 

La presente invention a egalement permis de reveler la 
sequence d'acides nucleiques du gene htfUIA et egalement la 
35 sequence d'acides amines de la proteine hTFIIIA codee par ce 
gene . 

La presente invention a ainsi pour objet la sequence 
d'ADN du gene htfUIA codant pour une proteine ayant la 




3 

fonction biologique du facteur de transcription humain 
hTFIIIA. 

La presente invention a precisement pour objet la 
sequence d'ADN du gene htfUIA du facteur de transcription 
5 humain hTFIIIA telle que d^finie ci-dessus codant pour la 
sequence d'acides amines SEQ ID N°2. 

Une telle sequence SEQ ID n°2 de la presente invention 
comprend done 365 acides amines. 

La presente invention a aussi pour objet la sequence 
10 d'ADN du gene htfUIA comme defini ci-dessus correspondant a 
la sequence de nucleotides SEQ ID N°3. 

La sequence SEQ ID N°3 comprend done 1273 nucleotides. 
La presente invention a notamment pour objet la sequence 
d'ADN du gene htfUIA comme defini ci-dessus correspondant a 
15 la sequence de nucleotides SEQ ID N°4. La sequence SEQ ID N°4 
comprend done 1213 nucleotides. 

La sequence SEQ ID N°l represente sur la ligne superieure la 
sequence de nucleotides du gene htfFIIIA selon la presente 
invention soit SEQ ID N°3, et sur la ligne inferieure, la 

2 0 sequence correspondante en acides amines (AA) de cette 
sequence de nucleotides soit SEQ ID N°2. 

Les figures 1 et 2 ci-apres representent sur la ligne 
superieure la sequence d 1 AA codee par htfUIA de la presente 
invention SEQ ID N°2 et sur la ligne inferieure, les 

25 sequences d'AA codees respectivement par les genes htfUIA de 
DREW, a la figure 1, et de ARAKAWA, a la figure 2, ces 
sequences de DREW et ARAKAWA etant telle s que publiees dans 
les documents references ci-dessus.. 

La figure 3 ci-apres represente la comparaison des 

30 sequences d'AA codees respectivement par les genes htfUIA de 
DREW et de ARAKAWA avec sur la ligne superieure, la sequence 
d'AA codee par htfUIA de ARAKAWA et sur la ligne inferieure, 
la sequence d'AA codee par htfUIA de DREW. 

La figure 2 montre done que la sequence d'AA 

35 correspondante de htfUIA selon la presente invention 

comporte des differences avec la sequence d'AA publiee dans 
1 'article de ARAKAWA ou dans EP 0704 526, notamment aux 
positions respectives correspondantes 105 et 163, 156 et 214, 



320 a 329 et 378 a 387, ces positions etant donnees par 
rapport a la numerotation indiquee sur la figure 2 . 

Ce.tte figure 2 montre egalement que la sequence d'AA 
codee par htfUIA de la presente invention debute en position 
5 59 de la sequence en AA de htfUIA de ARAKAWA. 

La figure 3 montre que les sequences d'AA codees par 
htfUIA de ARAKAWA et de DREW comport ent des differences aux 
positions respectives correspondantes 214 et 154, 378-387 et 
318-327, ces positions etant donnees par rapport a la 
10 numerotation indiquee sur la figure 3. 

La figure 5 montre que la sequence htfUIA de ARAKAWA 
code pour une proteine dont la sequence en acides amines, 
indiquee dans EP 0704 526, commence par 1'AA methionine 
specifie par le codon ATG qui se trouve en position 20-22 et 
15 la traduction s 1 arrete a un codon TAA. Si 1 1 on compare la 
sequence de nucleotides de htfUIA selon la presente 
invention SEQ ID N°3 avec la sequence de nucleotides de EP 
0704 526 soit htfUIA de ARAKAWA representee a la figure 5 
(sequence pll-12-13 de EP 0704 526), on constate qu'il manque 
20 un nucleotide C a la position 127 de la sequence de EP 0704 
526. Ce nucleotide C supplementaire a pour consequence un 
decalage dans la traduction en acides amines de cette 
sequence de nucleotides : en effet, 1 1 ATG qui se trouve a la 
position 20-22 de la sequence de ARAKAWA representee a la 

2 5 figure 5 et qui est considere comme codon initiateur de la 

synthese proteique par ARAKAWA n'est done plus, du fait de ce 
decalage, dans la meme phase de lecture. En tenant compte de 
ce nucleotide supplementaire C, la traduction en AA fait 
apparaitre un codon de terminaison TGA en position 57-59 de 

3 0 la sequence de ARAKAWA representee a la figure 5. Par 

consequent, le codon initiateur de la synthese proteique 
selon la presente invention est localisee en aval de ce codon 
de terminaison. Des experiences de traduction in vitro de SEQ 
ID N°4 et des tests d' expression dans des cellules de 
3 5 mammiferes telles que des cellules Cos ont permis 

d' identifier le codon d' initiation de la synthese proteique 
de hTFIIIA selon la presente invention. 

Ce codon initiateur de la synthese proteique de hTFIIIA 



selon la presente invention est le codon CTG en position 176- 
178 de SEQ ID N°3 (qui correspondrait a la position 194-196 
de la sequence de ARAKAWA representee a la figure 5) . 

La partie codante du gene htfUIA de la presente 
invention commence done par ce codon CTG qui se trouve a la 
position 176-178 de SEQ ID N°3 qui devrait correspondre a 
l'AA Leucine et qui correspond en fait a l'AA Methionine 
puisque ce codon est reconnu comme codon initiateur (ref : 
David S. Peabody The Journal of Biological Chemistry, vol. 
264, n°9, pp. 5031-5035, 1989). 

En consequence, la proteine hTFIIIA de ARAKAWA est plus 
longue comme le montre la figure 2 , que la proline hTFIIIA 
de la presente invention. 

Par ailleurs, si l'on compare la proteine hTFIIIA de la 
presente invention et la proteine hTFIIIA de DREW, (compari- 
son representee a la figure 1), on constate que 1 ' acide amine 
threonine en position 105 de la proteine hTFIIIA de la 
presente invention correspond a un residu asparagine en 
position 103 dans la sequence hTFIIIA de DREW et que les deux 
premiers AA, M et D de la proteine hTFIIIA de la presente 
invention n'ont pas ete determines pour la proteine hTFIIIA 
de DREW. L' absence des codons specif iant ces AA et notamment 
1 'absence du codon initiateur de la synthese proteique, ne 
permet pas 1' expression de cette proteine. La sequence 
htfUIA de DREW representee a la figure 4 est done incom- 
plete, comme le reconnaissent les auteurs de la publication 
referencee ci-dessus (DREW et al a la page 216 lignes 39-41) . 
On peut noter d' ailleurs que les auteurs de cet article 
pensent egalement que le codon initiateur de la sequence 
htfUIA de DREW devrait correspondre a une methionine codee 
par ATG comme dans la sequence de ARAKAWA. 

Le gene htfUIA selon la presente invention est done 
different des genes htfUIA de DREW et ARAKAWA (EP 0704526) 
et code pour une proteine hTFIIIA dont la sequence en AA est 
differente de celle des proteines hTFIIIA de DREW et ARAKAWA. 

La presente invention a ainsi particulierement pour 
objet la sequence d'ADN du gene htfUIA comme defini ci- 
dessus contenant la sequence de nucleotides SEQ ID N°3 . 



La presente invention a plus particulierement pour objet 
la sequence d 1 ADN comme defini ci-dessus ayant la sequence 
commencant au nucleotide 176 et se terminant au nucleotide 
1270 de SEQ ID N°3 . 
5 Une telle sequence de la presente invention commence 

done a un codon CTG et comprend done 1095 nucleotides. 

La presente invention a egalement pour objet la sequence 
d'ADN codant pour le facteur de transcription humain hTFIIIA 
comme defini ci-dessus ainsi que les sequences d'ADN qui 

10 hybrident avec celle-ci et/ou presentent des homologies 

signif icatives avec cette sequence ou des fragments de celle- 
ci et codant pour des proteines ayant la meme fonction. 
Par sequences qui hybrident, on inclut les sequences d'ADN 
qui hybrident avec 1 ' une des sequences d'ADN ci-dessus sous 

15 des conditions standard de stringence elevee, moyenne ou 

basse. Par proteines ayant la meme fonction, on inclut les 
polypeptides ayant la meme fonction de facteur de transcrip- 
tion. Les conditions de stringence sont celles realisees dans 
les conditions connues de l'homme du metier telles que celles 

20 decrites par Sambrook et al (1989) Molecular cloning, Cold 

Spring Harbor Laboratory Press, 1989. De telles conditions de 
stringence sont par exemple une hybridation a 65°C, pendant 
18 heures dans une solution 5 x SSPE ; 10 x Denhardt 1 s ; 
10 0^g/ml ADNss ; 1 % SDS suivie de 3 lavages pendant 5 minu- 

25 tes avec 2 x SSC ; 0,05 % SDS, puis 3 lavages pendant 15 

minutes a 65°C dans 1 x SSC ; 0,1 % SDS. Les conditions de 
forte stringence comprennent par exemple une hybridation a. 
6 5°C, pendant 18 heures dans une solution 5 x SSPE ; 10 x 
Denhardt • s ; 100/ig/ml ADNss ; 1 % SDS suivie de 2 lavages 

30 pendant 20 minutes avec une solution 2 x SSC ; 0,05 % SDS a 
65 °C suivis d'un dernier lavage pendant 4 5 minutes dans une 
solution 0,1 x SSC ; 0,1 % SDS a 65 °C. Les conditions de 
stringence moyenne comprennent par exemple un dernier lavage 
pendant 2 0 minutes dans une solution 0,2 x SSC, 0,1 % SDS a 

35 65°C. 

Par sequences qui presentent des homologies signif icatives , 
on inclut les sequences ayant une identite de sequence 
nucleotidique d'au moins 50 % avec 1 'une des sequences d'ADN 
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ci-dessus et qui codent pour une proteine ayant la meme 
fonction de facteur de transcription. 

La presente invention a egalement pour objet la sequence 
d'ADN comme defini ci-dessus comprenant des modifications 
5 introduites par suppression, insertion et/ou substitution 
d'au moins un nucleotide codant pour une proteine ayant la 
meme activite biologique que le facteur de transcription 
humain hTFIIIA. 

La presente invention a notamment pour objet la sequence 

10 d'ADN telle que definie ci-dessus ainsi que les sequences 
d'ADN similaires qui ont une homologie de sequence 
nucleotidique d'au moins 50 % ou au moins 60 % et de 
preference au moins 70 % avec ladite sequence d'ADN. 

La presente invention a ainsi Egalement pour objet 

15 la sequence d'ADN telle que definie ci-dessus ainsi que les 

sequences d'ADN qui codent pour une proteine dont la sequence 
en AA a une homologie d'au moins 40 % et notamment de 45 % ou 
d'au moins 50 %, plutot au moins 60 % et de preference au 
moins 70 % avec la sequence en AA codee par ladite sequence 

20 d'ADN. 

Le gene de la presente invention est represents comme 
une sequence ADN simple brin mais il est entendu que la 
presente invention inclut la sequence ADN complement a ire de 
cette sequence ADN simple brin et inclut egalement la 
2 5 sequence ADN dite double brin const ituee de ces deux 
sequences ADN complement a ires d'une de 1 'autre. 

La sequence ADN de la presente invention est un exemple 
de combinaison de codons codant pour les acides amines 
correspondant a la sequence d' acides amines SEQ ID N°2 mais 
30 il est entendu egalement que la presente invention inclut 
toute autre combinaison arbitraire de codons codant pour 
cette meme sequence d' acides amines SEQ ID N°2 . 

La sequence d'ADN telle que definie ci-dessus ou cette 
sequence d'ADN modifiee comme indiquee ci-dessus, peut etre 
35 preparee selon les techniques connues de l'homme du mStier et 
notamment celles decrites dans 1 ' ouvrage de Sambrook, J. 
Fritsh, E. F. § Maniatis, T. (1989) intitule" : « Molecular 
cloning : a laboratory manual », Laboratory, Cold Spring 




8 

Harbor NY. Notamment la sequence d'ADN ci-dessus peut etre 
une sequence d'ADNc obtenue par identification des parties 3' 
et 5 1 de la sequence codante, puis amplification de ces 
parties a 1 1 aide d'une ADN polymerase telles que la pfu 
5 polymerase ou d'autres ADN polymerases. L ' introduction, dans 
la sequence des oligonucleotides utilises pour la PCR, de 
sites de restriction tels que Hind III ou Smal permet le 
clonage de ces fragments dans des vecteurs adequats et 
ensuite la reconstitution de la sequence complete recherchee . 
10 Une description detaillee des conditions operatoires dans 
lesquelles a ete realisee la presente invention est donnee 
ci-apres . 

Li 1 invention a tout particulierement pour objet le 
polypeptide ayant la fonction de facteur de transcription 

15 humain hTFIIIA et ayant la sequence d'acides amines SEQ ID 

N°2 codee par la sequence d'ADN comme defini ci-dessus et les 
analogues de ce polypeptide. 

Par analogues, on entend les polypeptides dont la 
sequence d'acides amines a ete modifiee par substitution, 

2 0 suppression ou addition d'un ou plusieurs acides amines mais 
qui conservent la meme fonction biologique. De tels 
polypeptides analogues peuvent etre produits spontanement ou 
peuvent etre produits par modification post- transcription - 
nelle ou encore par modification de la sequence ADN de la 

25 presente invention comme indique ci-dessus, en utilisant les 
techniques connues de l'homme du metier : parmi ces techni- 
ques, on peut citer notamment la technique de mutagenese 
dirigee (Kramer, W. , et al . , Nucl . Acids Res., 12., 9441 
(1984) ; Kramer, W. and Fritz, H.J. , Methods in Enzymology, 

30 1 54 t 350 (1987) ; Zoller, M.J. and Smith, M. Methods in 
Enzymology, 100,468 (1983)). 

La synthese d'ADN modifies peut egalement etre faite en 
utilisant des techniques de synthese chimique bien connues 
telles que par exemple la methode au phosphotriester 

35 [Letsinger, R.L and Ogilvie, K.K., K. Am. CHEM. Soc . , £1,3350 
(1969) ; Merrifield, R.B., Sciences, 150 f 178 (1968)3 ou la 
methode a la phosphoamidite [Beaucage, S.L and Caruthers, 
M .H., Tetrahedron Lett., 22, 1859 (1981) ; McBRIDE, L.J. and 



Caruthers, M.H. Tetrahedron Lett., 24 245 (1983)] ou encore 
par la combinaison de ces methodes. 

Les polypeptides de la presente invention peuvent done 
etre prepares par les techniques connues de l'homme du 
metier, notamment partiellement par synthese chimique ou 
encore par la synthese de l'ADNc par expression dans une 
cellule note procaryote ou eucaryote comme indique ci-apres. 

La presente invention a particulierement pour objet le 
procede de preparation de la proteine recombinante hTFIIIA 
ayant la sequence d'acides amines SEQ ID N°2 . Ce procede 
inclut l'expression de la sequence d'ADN comme defini ci- 
dessus dans un note approprie puis I'isolement et la purifi- 
cation de ladite proteine recombinante. 

Pour produire le polypeptide de la presente invention, 
on peut notamment utiliser les techniques de 1 'ADN recombi- 
nant en utilisant les methodes de genie genetique et de 
culture cellulaire connues de l'homme du metier. On peut 
ainsi proceder par les etapes suivantes : d ' abord preparation 
du gene approprie, puis incorporation de ce gene dans un 
vecteur, transfert du vecteur porteur du gene dans une 
cellule hote appropriee, expression du gene et enfin, purifi- 
cation de la proteine codee par ce gene. 

Les sequences d'ADN selon la presente invention et notamment 
SEQ ID N°3 ou SEQ ID N°4 peuvent etre preparees selon les 
techniques connues de l'homme du metier, notamment par 
synthese chimique, par criblage d'une banque g<§nomique ou 
d'une banque d'ADNc a 1'aide de sondes d' oligonucleotides de 
synthese par les techniques connues d ' hybridation ou encore 
par reverse transcriptase a partir d'ARN messager (ARNm) . 

L'avantage de la technique comprenant d' abord I'isole- 
ment d ' ARNm par extraction des AKN totaux puis la synthese 
d'ADNc a partir de ces ARNm par reverse transcriptase reside 
notamment dans le fait que 1 1 ARNm ne contient pas les introns 
alors que ces sequences non codantes sont presentes dans 
1 1 ADN g^nomique. 

On peut done notamment proceder comme suit . 

On extrait d» abord les ARN totaux provenant d'une lign^e 

cellulaire telle que par exemple la lignee cellulaire Raji 
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(RNA Plus, BIOPROBE) et a partir de ces ARN, on procdde 
ensuite a la synthese de l'ADNc recherche en utilisant 
notamment un kit tel que ARN PCR kit (Perkin Elmer) . 

On peut noter que dans le cadre de la presente inven- 
5 tion, deux oligonucleotides localises aux extremit^s de la 
sequence codante htfUIA publiee par ARAKAWA (figure 5) ont 
£te" synthetises soit 0LT5 et OLT3 definis comme suit : 

- OLT5 : 5 ' CGGGGTACCAAAA ATG CGC AGC AGC GGC GCC GAC 3 1 soit 
SEQ ID N°5 et 

10 - OLT3 : 5' CGGTCTAGA TTA GCC AAG GGT AAG TAC TGC 3' soit SEQ 
ID N°9 

mais ces deux ol igo-nucleotides n'ont pas permis d ! obtenir un 
produit d' amplification par PCR. 

Ainsi dans le cadre de la presente invention, la 
15 sequence codante de hTFIIIA a ete isolee en deux etapes : 

d'abord identification de la partie 3' puis identification de 
la partie 5 ' . 

Apres identification des parties 3' et 5', un site de 
restriction Hindlll localise sur chacun de ces fragments a 
2 0 ensuite permis de reconstituer la sequence complete recher- 
chee comme indique ci- apres dans la partie experiment ale . 
On a done procede" comme suit : 

La partie 3* a ete amplifiee a l'aide de la pfu polymerase 
(STRATAGENE) en utilisant comme amorce les oligonucleotides 

2 5 OLT5.2 et TFIIIA 3 1 Smal soit : 

- OLT5.2 : 5 • TCCTTCCCTGACTGCAGCGCC 3* soit SEQ ID N°6 et 

- TFIIIA3'SmaI : 5*CCT CCC GGG GCC AAG GGT AAG TAC TGC AAC 
3 ' soit SEQ ID N°10 

Les amorces d ' amplification ou primers sont choisies en 

3 0 fonction de la partie a amplifier selon des criteres usuels 

pour l'homme du metier. 

Les amorces utilisees dans la presente invention ont &t€ 
choisies dans la sequence htfUIA de ARAKAWA representee a la 
figure 5. 

3 5 Les sequences SEQ ID N°6, SEQ ID N°7 et SEQ ID N°8 sont 

situees respect ivement aux positions 320-340 (5 1 — > 3'), 361- 
380 (sequence reverse et complementaire) et 391-410 (sequence 



reverse et complement a ire ) de cette sequence htfUIA de 
ARAKAWA . 

Les sequences SEQ ID N°5, SEQ ID N°9 et SEQ ID N°10 sont 
situees respectivement aux positions 20-40 (5*— 3 1 ), 1271 
1291 (sequence reverse et complementaire) et 1268-1288 
(sequence reverse et complementaire) de cette sequence 
htfUIA de ARAKAWA. 

On peut noter que dans les sequences SEQ ID N°5, SEQ ID N°9 
et SEQ ID N°10 contiennent les sequences correspondant aux 
sites d 1 enzymes de restriction soit respectivement Kpnl , Xbal 
et Smal . 

L 1 oligonucleotide TFIIIA 3* Smal introduit un site de 
restriction Smal en aval de la sequence codante. Ce site 
permet si necessaire et si desire la fusion de la sequence 
codant pour hTFIIIA avec une sequence codant pour un peptide 
epitope de 1 ' hemaglutinine designe « TAG HA ». L 1 expression 
de la sequence codant pour TFIIIA peut done etre associee a 
celle de la sequence codant pour TAG HA qui peut etre detecte 
en analyse par Western blot, si le gene de fusion est 
exprime . 

Pour 1 ' identification de la partie 5', cette region a 
ete isolee par la technique de PCR ancree 5' (5 race System, 
GIBCO BRL ; pfu polymerase, STRATAGENE) . Deux PCR successives 
ont ete effectuees en utilisant comme amorce les oligonu- 
cleotides suivants : UAP et TFIIIAPCR5 * pour la premiere PCR 
et UAP et TFIIIA SEQ2 pour la seconde PCR. 
UAP est un oligonucleotide fourni dans le kit. 

Ces oligonucleotides ont les sequences suivantes : 

- TFIIIAPCR5 ' : 5' CACAAACAAATGGTCTCC 3 ' soit SEQ ID N°8 

- TFIIIA SEQ2 : 5' TGCACAGGTGCGCGTCAAGC 3 ' soit SEQ ID N°7. 

Les produits de ces PCR soit les fragments 5 ■ et 3 ' 
amplifies sont ensuite purifies sur gel d' agarose et clones 
en utilisant le TA cloning kit (INVITROGEN) . On precede alors 
au sequencage : 1 1 ADN plasmidique de plusieurs clones 
independants est prepare (QIAGEN Plasmids KIT) et les 
fragments correspondant a la sequence codante de hTFIIIA sont 
sequences sur les deux brins (Sequenceur ABI 377XL, PERKIN 
ELMER) . 
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On peut done proceder comme suit et selon les techniques 
usuelles de clonage connues de 1 1 homme du metier et notamment 
on procede au clonage par insertion de chaque fragment dans 
un plasmide fourni avec le kit commercial (TA cloning Kit 
5 Invitrogen) puis transformation d'une souche bacterienne par 
le plasmide ainsi obtenu. On peut utiliser notamment la 
souche E. coli XL1 Blue. 

Les clones sont ensuite cultives pour extraire I'ADN 
plasmidique selon les techniques classiques de 1 • homme du 

10 metier referencees ci-dessus (Sambrook, Fritsh et Maniatis) . 

On procede au sequencage de l'ADN du fragment amplifie 
contenu dans l'ADN plasmidique. 

La compilation des donnees de la sequence ainsi obtenues 
fait apparaitre qu'en 3', l'essentiel de la sequence isolee 

15 correspond a la sequence htfUIA de Drew et al . 

En 5 1 , la sequence la plus longue debute en position 80 de la 
sequence htfUIA de Arakawa et al . , representee a la figure 
2F, et fait apparaitre 1 1 insertion d'un nucleotide C en 
position 12 7 par rapport a cette sequence. Si l'on peut 

20 supposer que la synthese de 1 'ADNc dans 1 1 application de la 

technique decrite ci-dessus n*a pas ete complete, 1 1 insertion 
d'un nucleotide cree cependant un probleme majeur. En effet, 
1' addition d'un nucleotide dans la sequence codante cree un 
decalage de la phase de lecture. Afin de verifier la presence 

25 de ce nucleotide dans le gene htfUIA, de l'ADN gehomique 
humain a ete analyse par PCR. Cet ADN a ete soumis a une 
reaction PCR a l'aide de la pfu polymerase (STRATAGENE) ou de 
la Taq polymerase (Perkin Elmer) et en utilisant comme amorce 
les oligonucleotides OLT5 et TFIIIA SEQ2 nommes respect i- 

3 0 vement SEQ ID N°5 et SEQ ID N°7. Les deux produits PCR ont 
Ite clones (TA cloning Kit) puis sequences. 

L' analyse des donnees de sequence confirme pour ces deux 
amplifications la presence de ce nucleotide C supplementaire 
par rapport a la sequence htfUIA de ARAKAWA. L'ATG deer it 

3 5 initialement comme codon initiateur de la synthese proteique 
pour hTFIIIA de ARAKAWA ne peut done plus etre considere 
comme tel . 

On procede ensuite a 1* assemblage des sequences 5* et 3' 
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et obtient un plasmide unique contenant la sequence recher- 
chee de hTFIIIA de la presente invention. On reconstitue la 
sequence codante hTFIIIA complete de la facon suivante . On 
digere un clone issu de 1 • amplification de l'ADN genomique a 
5 I'aide des enzymes de restriction EcoRI et Hindlll, et on 

obtient apres purification, un fragment de 350 pb environ. On 
digere par ailleurs un clone issu de 1 ' amplification de la 
partie 3* a I'aide des enzymes de restriction Hindlll et Smal 
et on obtient apres purification, un fragment de 930 pb 
10 environ. 

On procede ensuite a la ligation de ces fragments dans 
le plasmide pYX223 (vecteur d' expression pour la levure - 
R§D) prealablement digere par EcoRI et Smal. 

Un expose detaille des conditions dans lesquelles 

15 peuvent etre menees les operations indiqu£es ci-dessus est 

donne" ci-apres dans la partie experimental . On obtient ainsi 
un plasmide dans lequel est insure le gene de la presente 
invention et on obtient ainsi egalement ce plasmide introduit 
dans une cellule note en operant selon les techniques 

20 usuelles connues de l'homme du metier. 

Le polypeptide de la presente invention peut etre obtenu 
par expression dans une cellule h6te contenant la sequence 
d'ADN codant pour le polypeptide de 1 1 invention precedee 
d'une sequence promotrice convenable. La cellule note peut 

2 5 etre une cellule procaryote, par exemple E. coli ou une 

cellule eucaryote telle que les levures comme par exemple les 
ascomycetes parmi lesquels les Saccharomyces cerevisiae ou 
encore des cellules mammiferes comme les cellules Cos. 

La presente invention a part iculierement pour objet un 

30 vecteur d* expression contenant une sequence d'ADN comme 
defini ci-dessus. 

Ainsi un tel vecteur d' expression selon la presente 
invention contient une sequence d'ADN qui peut etre la 
sequence de nucleotides SEQ ID N°3 ou la sequence commencant 

35 au nucleotide 176 et se terminant au nucleotide 1270 de SEQ 
ID N°3. 

Un tel vecteur d' expression selon la presente invention 
peut egalement contenir les sequences d'ADN qui hybrident 
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avec les sequences definies ci-dessus et/ou presentent des 
homologies signif icatives avec ces sequences ou des fragments 
de celles-ci. 

Un tel vecteur d 1 expression selon la presente invention 
5 peut egalement contenir les sequences d'ADN qui comprennent 
des modifications introduites par suppression, insertion 
et/ou substitution d 1 au moins un nucleotide codant pour une 
proteine ayant la meme activite biologique que le facteur de 
transcription humain hTFIIIA. 

10 Les vecteurs d' expression sont des vecteurs permettant 

1' expression de la proteine sous le controle d'un promoteur 
convenable. Un tel vecteur peut etre un plasmide, un cosmide 
ou un ADN viral. Pour les cellules procaryotes, le promoteur 
peut etre par exemple le promoteur lac, le promoteur trp, le 

15 promoteur tac, le promoteur P~ lactamase ou le promoteur PL. 
Pour les cellules de levure, le promoteur peut etre par 
exemple le promoteur PGK ou le promoteur GAL. Pour les 
cellules de mammi feres, le promoteur peut etre par exemple le 
promoteur SV40 ou les promoteurs de 1 1 adenovirus . Des 

2 0 vecteurs type Baculovirus peuvent etre aussi utilises pour 
1' expression dans des cellules d'insectes. 

Les cellules notes sont par exemple des cellules proca- 
ryotes ou des cellules eucaryotes. Les cellules procaryotes 
sont par exemple E. coli, Bacillus ou Streptomyces . Les 

25 cellules notes eucaryotes comprennent des levures ainsi que 
des cellules d'organismes superieurs, par exemple des cellu- 
les de mammiferes ou des cellules d'insectes. Les cellules de 
mammiferes sont par exemple des fibroblastes tels que des 
cellules CHO ou BHK de hamster et des cellules Cos de singe. 

30 Les cellules d'insectes sont par exemple des cellules SF9 . 

La presente invention concerne done un proc£de qui 
comprend 1 ' expression de la proteine hTFIIIA dans une cellule 
note transformed par un ADN codant pour la sequence 
polypeptidique correspondant a la sequence SEQ ID N°2 . 

35 Pour la realisation de la presente invention, les 

vecteurs utilises peuvent etre par exemple pGEX ou pBAD et la 
cellule note peut 6tre E . coli ou par exemple le vecteur 
pYX223 et la cellule note peut etre egalement S. cerevisiae. 




15 

La presente invention a notamment pour objet une cellule 
hote transformee avec un vecteur tel que defini ci-dessus 
contenant le gene htfUIA selon la presente invention. 

La presente invention a tres precisement pour objet le 
5 plasmide depos£ a la CNCM sous le numero 1-2071. 

II s'agit ainsi de la souche XLl-Blue/pBShtf c2LHA renfermant 
le gene htfUIA selon la presente invention. 

Les conditions operatoires dans lesquelles a etl rlalisee la 
presente invention sont decrites ci-apres dans la partie 

10 experiment ale . 

La proteine hTFIIIA codee par le gene htfUIA est done un 
facteur de regulation de la transcription. En effet, la 
proteine hTFIIIA codee par le gene de la presente invention a 
un role biologique comme proteine se liant a l'ADN et le 

15 produit de ce gene est utile comme facteur de regulation de 
la transcription. 

En particulier, le gene de la presente invention est exprime 
dans differents tissus et joue probablement un role important 
dans 1' initiation de la transcription du gene de 1 'ARN ribo- 
20 somal 5S et dans le maintien de la stabilite de la transcrip- 
tion d'autres genes impliques notamment dans des fonctions de 
contrdle . 

Un tres grand nombre de maladies accompagnant un desordre 
dans le controle de la transcription ont recemment ete mises 

25 en evidence. Ainsi on a constate que certains produits 

oncogenes agissent comme des facteurs de regulation de la 
transcription et peuvent conduire a une cancerisation de 
cellules comme par exemple dans certaines leucemies ou encore 
que la production en trop grande quantite du facteur de 

30 regulation Hox2-4 induit une leucemie chez la souris. 

Par ailleurs, dans certaines maladies hereditaires , la 
proteine concernee peut etre en elle-meme normale, la 
pathogenicity resultant du mecanisme de transcription du gene 
codant pour cette proteine. Notamment, de nombreuses maladies 

35 hereditaires montrent une anomalie de la quantite de 

proteines synthetisees ce qui est probablement du a un 
desordre au niveau de la synthase proteique pouvant notamment 
mettre en jeu le gene htfUIA et la proteine codee en tant 
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que facteurs impliques dans le controle de la transcription 
de l'ARN 5S. 

Le gene de la presente invention peut ainsi etre utilise 
pour la recherche d 1 anomalies au niveau de la transcription 
des genes et notamment pour 1 ' identification de maladies 
hereditaires ou pour 1 1 etude de maladies mettant en cause les 
facteurs de regulation et notamment la proteine codee par 
htf IIIA. 

Le gene de la presente invention peut egalement etre 
utilise pour le traitement de certaines maladies a travers le 
controle de la transcription ou dans 1' analyse de la 
pathogenie de ces maladies. 

La presente invention prevoit done une utilisation du 
gene htf IIIA de la presente invention et de la proteine 
hTFIIIA de la presente invention, notamment pour contribuer a 
la comprehension du mecanisme de la transcription chez 
l'homme et pour contribuer egalement a la comprehension, au 
diagnostic et au traitement de maladies liees a un 
dereglement du mecanisme de transcription. Ainsi htf IIIA et 
la proteine hTFIIIA pourraient etre utilises dans le 
diagnostic ou 1 * identification de maladies hereditaires comme 
certains cancers ou d'autres maladies resultant d'un controle 
anormal de la transcription. 

Ces facteurs peuvent egalement etre utiles dans 1 1 analyse des 
mecanismes de regulation de la transcription. 

La presente invention a ainsi pour objet 1 ' utilisation 
du gene du facteur de transcription humain htf IIIA ou du 
facteur de transcription humain code par ce gene ainsi qu'il 
est defini ci-dessus pour la preparation de compositions 
utiles pour le diagnostic ou le traitement de maladies liees 
a un desordre dans le controle de la transcription. 

De telles compositions sont preparees dans les conditions 
usuelles connues de l'homme du metier. 

La presente invention a plus pr^cisement pour objet 
1 ■ utilisation telle que definie ci-dessus pour laquelle la 
maladie concernee est le cancer. 

Les figures 1 a 5 ci-apres presentent les illustrations 
suivantes . 
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La figure 1 represente la comparaison de la proteine hTFIIIA 
de la presente invention avec la proteine hTFIIIA de DREW. 
La figure 2 represente la comparaison de la proteine hTFIIIA 
de la presente invention avec la proteine hTFIIIA de ARAKAWA. 
5 La figure 3 represente la comparaison de la proteine hTFIIIA 
de DREW avec la proteine hTFIIIA de ARAKAWA. 
La figure 4 represente la sequence htfUIA de DREW et la 
proteine hTFIIIA correspondante . 

La figure 5 represente la sequence htfUIA de ARAKAWA et la 
10 proteine hTFIIIA correspondante. 

Les sequences indiquees dans la presente invention soit : SEQ 

ID N°l a SEQ ID N°10 sont decrites ci-apres. 

La partie experimentale ci-apres permet de decrire la 

presente invention sans toutefois la limiter. 
15 Parf.iP Pvp^rimfintale 

Exemple 1 : clonage et sequencage du gene hTFIIIA 

I) Extraction des ARN totaux provenant de la lignee 

cellulaire humaine RAJI (RNA Plus, BIOPROBE) 

La lignee cellulaire humaine RAJI a ete choisie comme source 
20 d'ARN totaux. Les cellules RAJI utilisees ont et# cultivees 
dans les conditions usuelles de culture de cette lignee que 
connait 1 1 homme du metier. 

Pour extraire les ARN totaux de ces cellules, on a procede 
selon un protocole usuel en utilisant la solution 
25 d' extraction commerciale RNA Plus ® (BIOPROBE SYSTEMS) . 
On a procede" de la maniere suivante : 
a) homogeriei sat ion : 

Les cellules cultivees en suspension sont sedimentees sans 
etre lavees au prealable pour eviter les risques de 

3 0 degradation des ARNm puis sont lysees par addition de la 

solution d' extraction du kit RNA plus ® a raison de 6 ml pour 
10 7 cellules. Les echantillons obtenus d'homogenat peuvent 
etre stockes a - 70 °C. 
HI PYfrarl- inn de 1 1 ARN : 

35 Apres homogen^isation, on laisse l'homogenat obtenu en a) ci- 
dessus a 4°C pendant 5 minutes afin de permettre la complete 
dissociation des complexes nucl£oprot£iques ; On ajoute 
ensuite 0.2 ml de chloroforme pour 1 ml de la solution de RNA 
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Plus ® ajout£e ci-dessus en a) , on agite vigour eusement 
pendant 15 secondes et on laisse reposer dans la glace pen- 
dant 5 minutes. On centrifuge, a 12000 g et a 4°C, pendant 15 
minutes . 

5 II se forme alors deux phases bien visibles : 1 'ADN et les 
proteines sont retrouves dans la phase organique ( phase 
inferieure) et a 1 1 interface . Les ARN sont dans la phase 
aqueuse (phase superieure) »qui represente environ 40 a 50 % 
du volume total . 

10 £_) Precipitation de l'ARN 

On trans fere la phase aqueuse obtenue en b) dans un tube 

neuf, on ajoute un volume d 1 isopropanol , et on place 

1 'echantillon, a 4°C pendant 15 minutes. On centrifuge 

1 • echantillon pendant 15 minutes a 4°C et 12000g. On obtient 

15 un pr£cipite qui forme un culot blanc- j aunatre au fond du 
tube . 

ci) Lavage rie 1 ' ARN 

On elimine le surnageant de la solution obtenue en c) puis on 
lave le culot avec une solution d'ethanol a 75% en utilisant 

2 0 au moins 0.8 ml d'ethanol pour 5 0 a 10 0 microgrammes d'ARN. 

On melange (vortex) , on centrifuge 10 minutes a 7500 g a 4°C 
et seche sous vide. L'ARN obtenu est alors repris dans 60 
microlitres de Tris 10 mM EDTA 1 mM pH=7,5. 
II) Synthese d'ADNc 
25 Reantifs utilises 

Le kit commercial Gene Amp® RNA PCR Kit (Perken Elmer) a ete 
utilise pour cette synthese d'ADNc. 

Par 1 1 utilisation de ce kit, on obtient d'abord la reverse 
transcription de l'ARN en ADNc par la reverse transcriptase 

3 0 MuLV (Murine Leukemia Virus) . Un inhibiteur de la RNase 

isolee a partir de placenta humain est inclus afin d ' inhiber 
certaines RNases de mammi feres. Les fragments d'ADNc sont 
amplifies par reaction de polymerisation en chaine (PCR) . 
L' enzyme utilisee pour cette reaction est la pfu polymerase 
35 (Stratagene) . 

L' expression dNTP designe les nucleotides dGTP, dATP, dTTP et 
dCTP. 
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L 1 expression PCR Buffer designe la solution renfermant 500 mM 
KC1 et 100 mM HC1 a pH 8.3. 

L 1 expression Oligod(T)16 designe une sequence nucleotidique 
constitute de 16 nucleotides dTTP. 
5 Des oligonucleotides sont utilises comme amorces dans la 
technique decrite ci-apres. 

Les concentrations indiquees ci-apres representent les 
concentrations finales dans le milieu reactionnel . 
hi .QvnfhPSP Hp> 1 1 a d tjp pa-r rpyftrse rrfancri nf.i on 

10 2 microlitres des ARN totaux (1 microgramme) obtenus ci- 

dessus en l)d) sont preincubes a 65°C pendant 5 minutes. On 
ajoute ensuite 8 microlitres de la solution reactionnelle 
suivante : 5mM MgCl2, lxPCR buffer, 1 mM de chaque dNTP, 5% 
de DMSO, 1 U/microlitre d'inhibiteur de RNase, 2.5 U/micro- 

15 litre de reverse transcriptase MuLV, 2.5 microlitres de 

oligo(dT)16. On incube alors a 42°C pendant une heure, puis a 
99°C pendant 5 minutes puis a 5°C pendant 5 minutes. 
Ill) Amplification par PCR, clonage et sequencage des 
sequences nucleot idiques 3' et 5 1 

2 0 ^ ronH-i t-ions rea ct. i onne.1 les 

La bacterie Escherichia coli (E. coli) XL1- Blue type K12 
(Stratagene) a ete utilisee pour la preparation des plasmides 
de la presente invention. 

La croissance de cette bacterie a ete effectuee selon les 
2 5 conditions usuelles en milieu liquide LB qui renferme lOg de 
bactotryptone, 5g d'extrait de levure et 10 g de NaCl pour un 
litre d'eau et qui renferme egalement 100 microg/ml 
d'ampicilline (SIGMA) . 

La colonie a ete prelevee sur milieu solide LB + agar + 
30 ampicilline puis cultivee dans 100 ml de milieu LB et incubee 
jusqu'a DO (600nm) = 0.8. 

L ' incubation a ete effectuee a 37°C sous atmosphere normale 
et agitation a 225 rpm. 

La viabilite de la souche est verifiee lorsque la souche 
35 pousse sur milieu LB + ampicilline a 100 microg/ml, 1 • insert 
renfermant un gene de resistance a 1 ' ampicilline bla. 
On peut noter qu'un gene de resistance a 1 1 ampicilline bla 
fait partie du vecteur du kit (TA cloning Kit - Invitrogen) 
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dans lequel sont clones les fragments de htfUIA. Ainsi, la 
selection des souches renfermant les plasmides contenant le 
gene htfUIA de la presente invention peut etre operee par la 
culture des souches dans ce milieu qui renfermant de l'ampi- 
5 cilline (100 microg/ml) , un tel milieu permettant la survie 
uniquement des souches qui renferment le gene de resistance a 
1 1 ampicilline et ainsi uniquement des souches qui renferment 
le gdne htfUIA de la presente invention. 

Pour la conservation des souches obtenues, 15 % de glycerol 
10 sont ajoutes au milieu de culture : les cultures sont done 
conservies dans le milieu de suspension LB +100 microgram- 
mes/ml d ' ampicilline + 15 % de glycerol a la concentration 
bacterienne de DO (600nm) = 0.8 sous forme d'aliquots en 
cryo tubes de 1ml par tube . 
15 Pour le sequencage, 1 'ADN plasmidique de plusieurs bact^ries 
issues de chacun des clonages indiques ci-apres est prepare 
en utilisant un kit commercial (Qiagen Plasmids kit) . Les 
fragments correspondant a la sequence codante de htfUIA sont 
sequences sur les deux brins suivant les techniques 
20 classiques connues de 1 * homme du metier (utilisation du 
sequenceur ABI 377 XL, Perkin Elmer) . 

b) Amplificati on par- PCR . et cl onagft deF? Sequences 

mmleotidiques 3' et 5' 

1) Amplification et clonage de la sequence nucleot idique 3 ' 
25 Deux amorces d ' amplification (primers) ont ete choisies 

d'apres la sequence publiee HTFUIA de ARAKAWA. Ces amorces 
OLT3 ou TFIIIA3 , SmaI et OLT5 . 2 sont nominees respect ivement 
SEQ ID N°10 et SEQ ID N°6. 

Ces oligonucleotides sont choisis dans la sequence hTFIIIA 
3 0 publiee de ARAKAWA (figure 5) et sont synth^tises selon les 
methodes classiques connues de 1 ■ homme du metier. 
L ' oligonucleotide TFIIIA3'SmaI introduit un site de 
restriction Smal en aval de la sequence codante. Ce site 
permettra la fusion de la sequence nucl^otidique 3 ' de 
3 5 htfUIA avec une sequence codant pour le peptide TAG 
hemaglutinine . 

Ainsi, le peptide resultant de 1 ' expression de la sequence 
clonee comprendra done a la fois la sequence de htfUIA de la 
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presente invention et celle du TAG HA et pourra ainsi etre 
detecte en analyse par Western selon les techniques usuelles 
connues de 1 ' homme du metier . 

On procede de la facon suivante : 2 microlitres d 1 ADNc obtenu 
5 ci-dessus en II )b) sont ajoutes a 50 microlitres de la 

solution reactionnelle suivante: 2mM MgC12, lxPCR buffer, 200 
nanogrammes/ml de chaque dNTP, les primers TFIIIA3 1 SMAI et 
OLT5.2 a raison de 0.15 micromoles/1 pour chacun, 5 % de DMSO 
et 2.5 U AmpliTaq ADN polymerase. 
10 L ' ADNc est ainsi soumis a 30 cycles PCR d'abord a 94°C , 

pendant une minute puis a 65°C pendant 1 minute puis a 72°C 
pendant 1 minute . 

Les produits amplifies par PCR ainsi obtenus sont done des 
fragments 3' d' environ 970 paires de bases. 

15 Les fragments 3 f obtenus ci-dessus sont clones dans le 

vecteur pCRII en utilisant le TA cloning Kit (Invitrogen) . 
Le plasmide ainsi obtenu est nomme 5.2 Ra j i 2.9. 
Ce plasmide est transf^re dans la souche E. coli XL1 Blue. 
On obtient done ainsi la souche E. coli transformed par le 

20 plasmide 5.2 Ra j i 2.9. 

2) Amplification et clonage de la sequence nucleotidique 5* 
La portion 5» du gene htfUIA de la presente invention a ete 
isolee par la technique dite de PCR ancree 5' en utilisant un 
kit commercial (5'RACE System, Rapid Amplification of ADNc 

2 5 Ends, GIBCO BRL) . 

Deux amorces d ' amplification (primers) ont ete choisies dans 
la sequence publiee htfUIA de ARAKAWA (cf. figure 5). 
Ces amorces TFIIIAPCR5 1 et TFIIIA SEQ2 sont nommees 
respect ivement SEQ ID N°8 et SEQ ID N°7. 

30 Une chaine homopolymerique est ajoutee a l'extremite 3» de 

l'ADNc en utilisant du dATP et la Terminal desoxynucleot idyl 
transferase (TdT) : 10 microlitres d ' ADNc obtenu ci-dessus en 
II) b) sont incubes a 37°C pendant 10 minutes dans la 
solution reactionnelle 1 X tailing buffer (solution du Kit 

35 commercial) et 0 . 2 mM de dATP et TdT. La TdT est inactivee 

pendant 10 minutes a 65 °C et la reaction est ensuite mise a 
4°C. 

La reaction est alors directement amplifiee par PCR : 10 
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microlitres de la reaction TdT sont ajout^s a 5 0 microlitres 
de solution reactionnelle PCR soit 1.5 mM de MgCl2 # lxPCR 
buffer, 200 nanomoles/ml de chaque dNTP, les primers UAP et 
TFIIIA PCR5 ' a raison de 0.2 micromoles/1 pour chacun, 5% de 
5 DMSO et 2.5 U AmpliTaq ADNpolymerase . 

Le primer UAP est un oligonucleotide fourni avec le kit 
commercial . 

L'ADNc est ainsi soumis a 30 cycles PCR d'abord a 94 °C 
pendant une minute, puis a 65 °C pendant 1 minute puis a 72 °C 

10 pendant 1 minute. 

Les produits amplifies par cette premiere PCR soit PCR1 sont 
soumis a une seconde reaction d • ampl if ication par PCR en 
utilisant le primer UAP et un primer specif ique TFIIIASEQ 2. 
On procede de la facon suivante : 5 microlitres de PCR1 

15 sont ajoutes a 50 microlitres de la solution reactionnelle de 
PCR indiquee ci-dessous (1.5 mM de MgCl2 , lxPCR buffer, 2 00 
micromoles/1 de chaque dNTP, les primers UAP et TFIIIA SEQ2 
a raison de 0.2 micromoles/1 pour chacun, 5% de DMSO et 2.5 U 
AmpliTaq ADN polymerase. 

20 L 'ADN est alors soumis a 3 0 cycles PCR d'abord a 94 °C pendant 
une minute, puis a 65 °C pendant 1 minute puis a 72 °C pendant 
1 minute . 

Les produits amplifies par cette seconde PCR soit PCR2 sont 
purifies sur gel d' agarose. Des fragments 5' d' environ 380 

25 paires de bases sont ainsi isoles. 

Les fragments 5 1 obtenus ci-dessus sont alors clones dans le 
vecteur pCRII en utilisant le TA cloning Kit (Invitrogen) . 
Le plasmide ainsi obtenu est nomme ADNc-DMSO-3 
Ce plasmide est transfer! dans la souche E. coli XL1 Blue. 

3 0 On obtient done ainsi la souche E. coli transformed par le 
plasmide ADNc-DMSO-3. 

3) Verification de la sequence 5 ! par amplification d 'ADN 
genomique - Construction du plasmide 5 geno-3 
On extrait de 1 'ADN genomique humain a partir de cellules 
35 humaines de foie selon les methodes usuelles connues de 
1 'homme du metier. 

On proedde a une amplification par PCR de 1 'ADN genomique 
humain de la facon suivante : 
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2 microgrammes d'ADN genomique humain obtenu comme indique 
ci-dessus sont ajoutes a 100 microlitres de la solution 
reactionnelle de PCR suivante : 2mM MgCl2, 1 x native Pfu ADN 
polymerase buffer, 200 nanogrammes/ml de chaque dNTP, les 
5 primers OLT5 et TFIIIASEQ2 a. raison de 0.15 micromoles/1 pour 
chacun, 5% de DMSO et 5 U pfu polymerase. 

OLT5 et TFIIIA SEQ2 sont nommes respect ivement SEQ ID N°5 et 
SEQ ID N°7. 

Le milieu react ionnel est ainsi soumis a 30 cycles PCR 
10 d'abord a 94 °C pendant une minute, puis a 60° C pendant 1 
minute puis a 72 °C pendant 1 minute. 

Les produits amplifies par PCR ainsi obtenus sont des 
fragments d'ADN d* environ 3 60 paires de bases. 
Les fragments ainsi obtenus sont clones dans le vecteur pCR- 
15 Script en utilisant le pCR-Script SK{+) Cloning kit 
(Stratagene) . 

Le plasmide ainsi obtenu est nomme 5 geno-3. 
Ce plasmide est transfere dans la souche E. coli XL1 Blue. 
On obtient done ainsi la souche E. coli transformee par le 
20 plasmide 5 geno-3. 

4) Clonage du gene htfUIA selon la presente invention - 
Construction du plasmide pYX TFIIIALHA 

On reconstitue la sequence codante htfUIA complete par 
1 'assemblage des deux fragments 3' et 5' obtenus ci-dessus en 
25 III) b)l) et III)b)3) 

Un site de restriction Hind III localise sur chacun des 
fragments 3' et 5' obtenus ci-dessus permet de reconstituer 
la sequence complete. 

Le plasmide 5 geno-3 obtenu ci-dessus en III)b)3) est digere 
30 par les enzymes de restriction EcoRl et Hindlll. Le site 
EcoRl est situe a 11 nucleotides en amont de la sequence 
codante . 

On obtient apres purification sur gel d 1 agarose des fragments 
d' environ 350 paires de bases. 
3 5 On procede alors a la ligation avec le vecteur pYX/EcoRI + 
Hindlll et obtient le vecteur pYXTFIIIAB'. 
On procede ensuite a 1 'addition du fragment 3' sur le 
fragment 5' : le plasmide 5.2 Ra j i 2.9 obtenu ci-dessus en 
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III) b) 1) , est digere par les enzymes de restriction Hindlll 
et Smal . 

Aprds purification sur gel d 1 agarose, on obtient un fragment 
d ' environ 93 0 paires de bases. Ce fragment est insere" dans le 
5 plasmide pYXTFIIIAS' obtenu ci-dessus prealablement digere 
par les enzymes de restriction Smal et Hindlll. 
On obtient ainsi le plasmide pYXTFI 1 I ALHA qui contient done 
le gene hTFIIIA de la pre sent e invention. 

Exemple 2 : Construction de la souche XL1 Blue/pYX TFIIIALHA 

10 Pour la preparation de la souche XLl-Blue/ pYX TFIIIALHA, on 
proedde selon les techniques connues de 1 ' homme du metier 
(ref ci-dessus : Sambrook, Fritsh et Maniatis) a partir de la 
souche E. Coli XL1- Blue type K12 (Stratagene) et introduit 
le plasmide pYX TFIIIALHA obtenu ci-dessus a 1 ' exemple 1 . 

15 Exemple 3 : Construction du plasmide pBS- tf C2LHA 

On utilise le vecteur pBS-SK+ (Stratagene) dans lequel on 
integre un insert codant pour le gene htfUIA de la pr^sente 
invention. On procede comme suit : le plasmide pYXTFI I I ALHA 
obtenu ci-dessus a 1 1 exemple 1 est digere" par 1* enzyme de 

20 restriction EcoRI, cette extre^nite est remplie a 1 ' aide de 

1 'ADN Polymerase (fragment de Klenow) et en presence de dNTP. 
Ce plasmide est ensuite digere par Nhe I et le fragment 
correspondant a la sequence de htfUIA selon la presente 
invention est purifie. Ce fragment est insere dans le vecteur 

25 pBS-SK+ prepare comme suit : le vecteur est digere par EcoRI, 
ce site est rempli a 1 ' aide de 1 'ADN polymerase puis digere 
par Xbal . 

On obtient ainsi le plasmide pBS - t f C2LHA . 

Exemple 4 : Construction de la souche XLl -Blue/pBS- tfC2LHA 

30 Pour la preparation de la souche XL1 - Blue/pBS- tfC2LHA, on 

procede selon les techniques connues de l 1 homme du metier a 
partir de la souche E. Coli XL1- Blue type K12 (Stratagene) 
et introduit le plasmide pBS- tf C2LHA obtenu ci-dessus a 
1 • exemple 3 . 

35 Un echantillon de la souche obtenue soit E. Coli XL1- Blue 
type K12 (Stratagene) contenant le vecteur pBS-SK+ 
(Stratagene) avec un insert codant pour tfC2 (partie codant e 
ADNc contenant la region codante de htfUIA) soit XL1- 
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Blue/pBS-tf C2LHA a ete depose a 1 ' Institut Pasteur 25, rue ciu 
Docteur ROUX Paris 75015 a la CNCM le 15 Septembre 1998 sous 
le numero 1-2071. 

Exemple 5 : Identification du codon initiateur de la synthese 
5 proteique. 

La purification de la proteine hTFIIIA a ete decrite par 
Moorefield et al (1994) [reference : the Journal of 
Biological Chemistry, Vol.269, N°33, pp . 20857 -2 0865 , 1994, 
Purification and Characterization of Human Transcription 

10 Factor IIIA, B. Moorefield and R. G. Roeder] . 

La proteine hTFIIIA identifiee par Moorefield a un poids 
moleculaire de 42 kDa . On peut noter que le poids moleculaire 
theorique de la proteine hTFIIIA codee par la sequence 
htfUIA de ARAKAWA est de 47 kDa. 

15 La synthese proteique est generalement initiee au niveau d'un 
codon ATG. Cependant la sequence codante de htfUIA de la 
presente invention ne contient pas de codon ATG en phase. 
II a ete demontre que des codons differents de ATG, en 
particulier les codons CTG ou GTG sont des codons d'initia- 

20 tion de la traduction dans des transcrits cellulaires 
naturels . 

Par des techniques connues de 1 ' homme du metier telles que 
des experiences de traduction in vitro de la sequence htfUIA 
' selon la presente invention obtenue ci-dessus a 1 • exemple 1 
25 et par des tests d 1 expression dans des cellules de mammiferes 
comme des cellules Cos, le codon initiateur de la synthese 
proteique de hTFIIIA selon la presente invention a ete mis en 
evidence . 

Dans le cadre de la presente invention, il a ainsi ete mis en 
30 evidence que le codon initiateur de la synthese proteique de 
hTFIIIA selon la presente invention est le codon CTG qui se 
trouve a la position 176-178 de SEQ ID N°3. 
Analyse des resultats 

L* analyse des resultats obtenus par les preparations des 
35 exemples indiques ci-dessus fait apparaitre les points 
suivants relatifs a la sequence codante de htfUIA : 
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- en 3' (ci-dessus en III)b)l)) l'essentiel de la sequence 
isolee dans la presente demande correspond a la sequence 
htfUIA de DREW 

- en 5 1 (ci-dessus en III)b)3)) la sequence la plus longue 
5 des fragments obtenus par la preparation decrite ci-dessus 

en III)b)3) debute en position 20 de la sequence htfUIA de 
ARAKAWA et fait apparaitre 1' insertion d'un nucleotide en 
position 12 7 de la sequence htfUIA de ARAKAWA. 

Les resultats obtenus par les preparations decrites ci- 
10 dessus de htfUIA selon la presente invention confirment 
qu'un nucleotide en position 127 omis dans la sequence de 
ARAKAWA existe bien dans le gene humain htfUIA. 
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REVEND I CATI ONS 



1) Sequence d'ADN du gene htfUIA codant pour une proteine 

ayant la fonction biologique du facteur de transcription 
humain hTFIIIA. 
5 2) Sequence d'ADN du gene htfUIA du facteur de 

transcription humain hTFIIIA selon la revendicat ion 1 
codant pour la sequence d'acides amines SEQ ID N°2. 
3) Sequence d'ADN du gene htfUIA selon la revendication 1 
ou 2 contenant la sequence de nucleotides SEQ ID N°3 
10 4) Sequence d'ADN du gene htfUIA selon les revendicat ions 1 
a 3 contenant la sequence de nucleotides SEQ ID N°4 . 
5) Sequence d'ADN selon la revendication 4 ayant la sequence 

commencant au nucleotide 176 et se terminant au nucleotide 
1270 de SEQ ID N°3 . 
15 6) Sequence d'ADN codant pour le facteur de transcription 

humain hTFIIIA selon les revendicat ions 1 a 5 ainsi que les 
sequences d'ADN qui hybrident avec celle-ci et/ou presentent 
des homologies signif icatives avec cette sequence ou des 
fragments de celle-ci et qui codent pour une proteine ayant 

2 0 la meme fonction. 

7) Sequence d'ADN selon les revendicat ions 1 a 6 comprenant 

des modifications introduites par suppression, insertion 
et/ou substitution d'au moins un nucleotide codant pour une 
proteine ayant la meme activite biologique que le facteur de 
25 transcription humain hTFIIIA. 

8) Sequence d'ADN selon l'une des revendications 1 a 7 ainsi 

que les sequences d'ADN similaires qui ont une homologie de 
sequence nucleotidique d'au moins 50 % ou au moins 60 % et de 
preference au moins 7 0 % avec ladite sequence d'ADN. 
30 9) Sequence d'ADN selon l'une des revendications 1 a 8 ainsi 
que les sequences d'ADN similaires qui codent pour une 
proteine dont la sequence en AA a une homologie d'au moins 
40 % et notamment de 45 % ou d'au moins 5 0 %, .plutot au 
moins 6 0 % et de preference au moins 70 % avec la sequence 

3 5 en AA codee par ladite sequence d'ADN. 
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10) Polypeptide ayant la fonction de facteur de transcrip- 
tion humain hTFIIIA et ayant la sequence en acides amines 
SEQ ID N°2 codee par la sequence d f ADN selon l'une des 
revendications 1 a 9 et les analogues de ce polypeptide. 
5 11) Procede de preparation de la proteine recombinante 
hTFIIIA ayant la sequence d 1 acides amines SEQ ID N°2 
comprenant 1' expression de la sequence d'ADN selon l'une 
des revendications 1 a 9 dans un note approprie puis 
l'isolement et la purification de ladite proteine 
10 recombinante 

12) Vecteur d 1 expression contenant la sequence d'ADN" selon 

l'une des revendications 3 a 9. 

13) Cellule note transformed avec un vecteur selon la 
revendication 12 

15 14) Plasmide depose a. la CNCM sous le numero 1-20 71 

15) Utilisation du gene du facteur de transcription humain 

htflllA ou du facteur de transcription humain code par ce 
gene selon l'une des revendications 1 a 10 pour la 
preparation de compositions utiles pour le diagnostic ou le 
20 traitement de maladies liees a un desordre dans le contrSle 
de la transcription. 

16) Utilisation selon la revendication 15 pour laquelle la 
maladie concernee est le cancer. 
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1 MDPPAVVAESVSSLTIADAFIAAGESSAPTPPRPALPRRFICSFPDCSAN 50 

MMM M MIM MMMIMI I I MM I II III II 111 Mill I II 

1 . . PPAWAESVSSLTIADAFIAAGESSAPTPPRPALPRRFICSFPDCSAN 4 8 
51 YSKAWKLDAHLCKHTGERPFVCDYEGCGKAFIRDYHLSRHILTHTGEKPF 100 

M IMIIMI M Ml I IMMIMM I Mill M III II MM M MMI 

4 9 YSKAWKLDAHLCKHTGERPFVCDYEGCGKAFIRDYHLSRHILTHTGEKPF 98 
101 VCAATGCDQKFNTKSNLKKHFERKHENQQKQYICSFEDCKKTFKKHQQLK 150 

II I I MHI I MM IIMIIIMM I M Ml I M Ml II III MMM I! 

99 VCAANGCX>QKFNTKSNLKKHFERKHENQQKQYICSFEDCKKTFKKHQQLK 14 8 
151 IHQCQHTNEPLFKCTQEGCGKHFAS PS KLKRHAKAHEGYVCQKGCS FVAK 2 0 0 

I MIMM II I MM MMMIMI I I I III I M Ml MIMIII III II 

14 9 IHQCQHTNEPLFKCTQEGCGKHFAS PS KLKRHAKAHEGYVCQKGCS FVAK 198 

2 01 TWTELLKHVRETHKEEILCEVCRKTFKRKDYLKQHMKTHAPERDVCRCPR 250 

I M Mill II I MM I MIMM II II MIMIMMM I II MIIIMI 

199 TWTELLKHVRETHKEE ILCEVCRKTFKRKDYLKQHMKTHAPERDVCRCPR 24 8 
251 E GCGRT YTTVFNLQ S H IL S FHE E S R P F VCEHAGCG KT F AMKQS LTRHAW 3 00 

III Mill II I Mil! MIMM Ml I II II I IMM M MM II Mill 

24 9 EGCGRTYTTVFNLQSHILSFHEESRPFVCEHAGCGKTFAMKQS LTRHAW 2 98 

3 01 HDPDKKKMKLKVKKSREKRSLASHLSGYIPPKRKQGQGLSLCQNGESPNC 350 

III III M II I IMMIIIMM II II MM I M Ml M I MMMIMI 

2 99 HDPD KKKM KL KVKKS RE KR S LAS HLS G Y I P P KR KQGQGL S LCQNG ES PNC 34 8 
351 VEDKMLSTVAVLTLG 365 

I II IM M II I M II 

34 9 VEDKMLSTVAVLTLG 363 
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1 MDPPAWAESVSSLTIADAFIAAGESSAPTPPRPALPRRFIC 42 

M II I MM III MIMMM Mlllll I M III Mill III 

51 PGIiGGAGALDPPAWAESVSSLTIADAFIAAGESSAPTPPRPALPRRFIC 100 
4 3 SFPDCSANYSKAWKLDAHLCKHTGERPFVCDYEGCGKAFIRDYHLSRHIL 92 

I III Mill I II I MM III II III MM IIIM II I II III Mill IN 

101 SFPDCSANYSKAWKLDAHLCKHTGERPFVCDYEGCGKAFIRDYHLSRHIL 150 
93 THTG EKP F VCAATGCDQ KFNTKSNLKKHF ERKHENQQKQ Y ICS FEDC KKT 142 

MIIMIMMI MM 11 I IIIIIMM Mlllll I Mill Mill Ml 

151 THTGEKPFVCAANGCDQKFNTKSNLKKHFERKHENQQKQYICSFEDCKKT 200 
14 3 FKKHQQLKIHQCQHTNEPLFKCTQEGCGKHFASPSKLKRHAKAHEGYVCQ 192 

MM MM I I II Mill IIIM Mlllll Mlllll IMIM Mill III 

201 FKKHQQLKIHQCQNTNEPLFKCTQEGCGKHFASPSKLKRHAKAHEGYVCQ 250 
193 KGC S FVAKTWTE LLKHVRETHKEE I LCE VCRKT F KRKD YLKQHMKTHAPE 242 

llllllll MM 1 MM III IMMIMI Mlllll I II Ml II III III 

251 KG CSFVAKTWTE LLKHVRETHKEE I LCEVCRKTF KRKD YLKQHMKTHAPE 3 00 
243 RDVCRCPREGCGRTYTTVFNLQSHILSFHEESRPFVCEHAGCGKTFAMKQ 2 92 

MM MM III I I MM III Mill MM IMIMI I II Ml Mill III 

301 RDVCRCPREGCGRTYTTVFNLQSHILSFHEESRPFVCEHAGCGKTFAMKQ 350 
293 S LTRHAWHDPD KKKMKLKVKKS RE KRS LAS HLS GY I P PKRKQGQGL SLC 34 2 

II M I Ml I III I II 1 1 II I M III 1 1 MIMMMIMI 

351 S LTRHAWHDPD KKKMKLKVKKS RE KREFGLS SQWI YPPKRKQGQGLSLC 4 00 
34 3 QNGESPNCVEDKMLSTVAVLTLG 3 65 

I IM MM MM III II I M I II 

401 QNGESPNCVEDKMLSTVAVLTLG 4 23 
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51 PGLGGAGALDPPAWAESVSSLTIADAFIAAGESSAPTPPRPALPRRFIC 100 

I ill I llllll I II I II Ml MMIIIMIIIIIIM II I 

1 PPAWAESVSSLTIADAFIAAGESSAPTPPRPALPRRFIC 4 0 



101 S F PDCS ANYS KAWKLDAHLCKHTGERP FVCDYEGCGKAF I RD YHLS RH I L 150 

M I II llllll Illllll Ml M NM Ml M I MIMIIIMIM I II I 

41 SFPDCSANYSKAWKLDAHLCKHTGERPFVCDYEGCGKAFIRDYHLSRHIL 90 
151 THTGEKPFVCAANGCDQKFNTKSNLKKHFERKHENQQKQYICSFEDCKKT 200 

II I II IIMI I MM I III lllll 111 III Illllll Mill NM I II I 

91 THTGEKPFVCAANGCDQKFNTKSNLKKHFERKHENQQKQYICSFEDCKKT 14 0 
2 01 FKKHQQLKIHQCQNTNEPLFKCTQEGCGKHFASPSKLKRHAKAHEGYVCQ 250 

ii m mm im iii urn 1 1 ii imiiiiiiii ill him ii i 

141 FKKHQQLKIHQCQHTNEPLFKCTQEGCGKHFASPSKLKRHAKAHEGYVCQ 190 

2 51 KGCSFVAKTWTELLKHVRETHKEE ILCEVCRKTFKRKDYLKQHMKTHAPE 300 

M I ! M I i M I 1 1 1 1 1 I r I I r I 1 1 i J r I I M I 1 1 1 M 1 M I f 1 1 1 1 ! I i I 

191 KGCSFVAKTWTELLKHVRETHKEE ILCEVCRKTFKRKDYLKQHMKTHAPE 240 

3 01 RDVCRCPREGCGRTYTTVFNLQSHILS FHEESRPFVCEHAGCGKTFAMKQ 350 

1 1 mini immmm iimi i mm iiiiiiiiiiiMiiiiii i 

241 RDVCRCPREGCGRTYTTVFNLQSHILS FHEESRPFVCEHAGCGKTFAMKQ 290 
351 SLTFJIAVVHDPDKKKMKLKVKKSREKREFGLSSQWIYPPKRKQGQGLSLC 4 00 

I Mil I Ii 1 1 I I Mill I IM I I II 1 1 MMMIIMIM 

2 91 S LTRHAVVHDPDKKKMKL KVKKS RE KR S LAS HL SG Y I PP KRKQGQGL S LC 340 
401 QNGES PNCVEDKMLSTVAVLTLG 42 3 

IM I M III III M MM Ml I 

341 QNGES PNCVEDKMLSTVAVLTLG 363 
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1 CCGCCGGCCGTGGTCGCCGAGTCGGTGTCGTCCTTGACCATCGCCGACGC 
1PPAVVAESVSSLTIADA 



50 
17 



51 GTTCATTGCAGCCGGCGAGAGCTCAGCTCCGACCCCGCCGCGCCCCGCGC 100 
18 FIAAGESSAPTPPRPAL 34 



101 TTCCCAGGAGGTTCATCTGCTCCTTCCCTGACTGCAGCGCCAATTACAGC 150 



35 PRRFICSFPDCSANYS 



50 



151 AAAGC CTGG AAGCTTG ACG CGC ACCTG TGC AAGCACACGGGGG AGAGAC C 200 
51KAWKLDAHLCKHTGERP 67 



2 01 ATTTGTTTGTGACTATG AAGGG TGTGG CAAGGCCTTCATCAGGGACTACC 250 
68 FVCDYEGCGKAFIRDYH 84 



2 51 ATCTGAGCCGCCACATTCTGACTCACACAGGAGAAAAGCCGTTTGTTTGT 300 
85 LSRHILTHTGEKPFVC 100 



3 01 GCAGCCAATGGCTGTGATCAAAAATTCAACACAAAATCAAACTTGAAGAA 350 
101 AANGCDQKFNTKSNLKK 117 



3 51 ACATTTTGAACGCAAACATGAAAATCAACAAAAACAATATATATGCAGTT 400 
118 HFERKHENQQKQYICSF 134 



4 01 TTGAAGACTGTAAGAAGACCTTTAAGAAACATCAGCAGCTGAAAATCCAT 4 50 
135 EDCKKTFKKHQQLKIH 150 



4 51 CAGTGCCAGCATACCAATGAACCTCTATTCAAGTGTACCCAGGAAGGATG 500 
151 QCQHTNEPLFKCTQEGC 167 



501 TGGGAAACACTTTGCATCACCCAGCAAGCTGAAACGACATGCCAAGGCCC 550 
168 GKHFASPSKLKRHAKAH 184 



551 ACGAGGGCTATGTATGTCAAAAAGGATGTTCCTTTGTGGCAAAAACATGG 600 
185 EGYVCQKGCS FVAKTW 200 



601 ACGGAACTTCTGAAACATGTGAGAGAAACCCATAAAGAGGAAATACTATG 650 
201 TELLKHVRETHKEEI LC 217 
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651 TGAAGTATGCCGGAAAACATTTAAACGCAAAGATTACCTTAAGCAACACA 700 
218 EVCRKT FKRKDYLKQHM 234 

701 TGAAAACTC ATGC CCCAG AAAGGG ATGTATGTCG CTG TC CAAG AG AAGGC 750 
235 KTHAPERDVCRCPREG 250 



751 TGTGGAAGAACCTATACAACTGTGTTTAATCTCCAAAGCCATATCCTCTC 800 
251 CGRTYTTVFNLQSHILS 267 



801 CTTCCATGAGGAAAGCCGCCCTTTTGTGTGTGAACATGCTGGCTGTGGCA 850 
268 FHEESRPFVCEHAGCGK 284 



851 AAACATTTGCAATGAAACAAAGTCTCACTAGGCATGCTGTTGTACATGAT 900 
285 TFAMKQSLTRHAVVHD 300 



901 CCTGACAAGAAGAAAATGAAGCTCAAAGTCAAAAAATCTCGTGAAAAACG 950 
301 PDKKKMKLKVKKSREKR 317 



951 GAGTTTGGCCTCTCATCTCAGTGGATATATCCCTCCCAAAAGGAAACAAG 1000 
318 SLASHLSGYIPPKRKQG 334 



1001 GGCAAGGCTTATCTTTGTGTCAAAACGGAGAGTCACCCAACTGTGTGGAA 105 0 
335 QGLSLCQNGES PNCVE 350 



1051 GACAAGATGCTCTCGACAGTTGCAGTACTTACCCTTGGCTAAGAACTGCA 110 0 
351 DKMLSTVAVLTLG* 364 



1101 CTGCTTTGTTTAAAGGACTGCAGACCAAGGAGCGAGCTTTCTCTCAGAGC 1150 
1151 ATGCTTTTCTTTATTAAAATTAC 1173 
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1 ATGCGCGATCTCCCGGAGCATGCGCAGCAGCGGCGCCGACGCGGGGCGGT 5 0 
1 MRSSGADAGRC 11 



51 GCCTGGTGACCGCGCGCGCTCCCGGAAGTGTGCCGGCGTCGCGCGAAGGT 100 

12 LVTARAPGSVPASREG 27 

101 TCAGCAGGGAGCCGTGGGCCGGGCGCGCGGTTCCCGGCACGTGTCTCGGC 150 

28SAGSRGPGARFPARVSA 44 

151 ACGTGGCAGCGCGCCTGGCCCTGGGCTTGGAGGCGCCGGCGCCCTGGATC 200 

45 RGSAPGPGLGGAGALDP 61 



2 01 CGCCGGCCGTGGTCGCCGAGTCGGTGTCGTCCTTGACCATCGCCGACGCG 2 50 
62 PAVVAESVSSLTIADA 77 



251 TTCATTGCAGCCGGCGAGAGCTCAGCTCCGACCCCGCCGCGCCCCGCGCT 3 00 

78 F I AAGESSAPTP PRPAL 94 

301 TCCCAGGAGGTTCATCTGCTCCTTCCCTGACTGCAGCGCCAATTACAGCA 3 50 

95 PRRFICSFPDCSANYSK 111 

351 AAGCCTGGAAGCTTGACGCGCACCTGTGCAAGCACACGGGGGAGAGACCA 400 

112 AWKLDAHLCKHTGERP 127 



4 01 TTTGTTTGTGACTATGAAGGGTGTGGCAAGGCCTTCATCAGGGACTACCA 45 0 

128 FVCDYEGCGKAF I RDYH 144 

451 TCTGAGCCGCCACATTCTGACTCACACAGGAGAAAAGCCGTTTGTTTGTG 500 

145 LSRHILTHTGEKPFVCA 161 



501 CAGCCAATGGCTGTGATCAAAAATTCAACACAAAATCAAACTTGAAGAAA 550 
162 ANGCDQKFNTKSNLKK 177 



551 CATTTTGAACGCAAACATGAAAATCAACAAAAACAATATATATGCAGTTT 600 
178HF ERKHENQQKQY I CSF 194 



601 TGAAGACTGTAAGAAGACCTTTAAGAAACATCAGCAGCTGAAAATCCATC 650 

195 EDCKKTFKKHQQLKIHQ 211 

651 AGTGCCAGAATACCAATGAACCTCTATTCAAGTGTACCCAGGAAGGATGT 7 00 

212 CQNTNEPLFKCTQEGC 227 
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701 
228 



751 
245 



801 
262 



851 
278 



901 
295 



951 
312 



1001 
328 



1051 
345 



1101 
362 



1151 
378 



1201 
395 



1251 
412 



1301 



GGG AAACACTTTG C ATC ACCC AGCAAG C TGAAACG AC ATG CC AAGGCCC A 750 
GKHFAS P SKLKRHAKAH 244 



CGAGGGCTATGTATGTCAAAAAGGATGTTCCTTTGTGGCAAAAACATGGA 800 
EGYVCQKGCSFVAKTWT 261 



CGGAACTTCTGAAACATGTGAGAGAAACCCATAAAGAGGAAATACTATGT 850 
ELLKHVRETHKEEILC 277 



G AAGTATG C CGGAAAAC ATTTAAACGC AAAG ATTAC CTT AAGCAACACAT 900 
EVCRKTF KRKDYLKQHM 294 



GAAAACTCATGCCCCAGAAAGGGATGTATGTCGCTGTCCAAGAGAAGGCT 950 
KTHAPERDVCRCPREGC 311 



GTGGAAGAACCTATACAACTGTGTTTAATCTCCAAAGCCATATCCTCTCC 1000 
GRTYTTVFNLQS HILS 327 



TTCCATGAGGAAAGCCGCCCTTTTGTGTGTGAACATGCTGGCTGTGGCAA 1050 
FHEESRPFVCEHAGCGK 344 



AAC ATTTGCAATG AAAC AAAGT CTCACTAGG CATGCTGTTGTAC ATG ATC 1100 
TFAMKQS LTRHAVVHDP 361 



CTGACAAGAAGAAAATG AAGCTCAAAGTCAAAAAATCTCGTG AAAAACGG 1150 
DKKKMKLKVKKS REKR 377 



GAGTTTGGCCTCTCATCTCAGTGG ATATATCCTCCCAAAAGG AAACAAGG 1200 
EFGLSSQWIYPPKRKQG 394 



GCAAGGCTTATCTTTGTGTCAAAACGGAGAGTCACCCAACTGTGTGGAAG 125 0 
QGLSLCQNGESPNCVED 411 



ACAAGATGCTCTCGACAGTTGCAGTACTTACCCTTGGCTAAGAACTGCAC 1300 
KMLSTVAVLTLG * 424 



TGCTTTGTTTAAAGGACTGCAGACCAAGGAGTCGAGCTTTCTCTCAGAGC 135 0 



TTTATTAAAATTACTGATGCAGAAAAAAAAAAAAAAAAAA 13 99 



FIGURE 5 



.« ess**** 



LI STAGE DE SEQUENCE 

<110> Hoechst Marion Roussel 

<12 0> Gene humain htfUIA et la proteine codee hTFIIIA. 

<130> 9823seq 

<140> 
<141> 

<160> 10 

<170> Patentln Vers- 2.0 

<210> 1 
<211> 1273 
<212> ADN 
<213> Human 

<220> 
<221> CDS 

<222> (176) . . (1270) 
<400> 1 

atgcgcagca gcggcgccga cgcggggcgg tgcctggtga ccgcgcgcgc tcccggaagt 60 

gtgccggcgt cgcgcgaagg ttcagcaggg agccgtgggc cgggcgcgcc ggttcccggc 12 0 

acgtgtctcg gcacgtggca gcgcgcctgg ccctgggctt ggaggcgccg gcgcc ctg 178 

Met 
1 



J 



gat ccg ccg gcc gtg gtc gcc. gag teg gtg teg tec ttg ace ate gee 
Asp Pro Pro Ala Val Val Ala Glu Ser Val Ser Ser Leu Thr lie Ala 
5 10 15 

gac gcg ttc att gca gcc ggc gag age tea get ccg acc ccg ccg cgc 
Asp Ala Phe lie Ala Ala Gly Glu Ser Ser Ala Pro Thr Pro Pro Arg 
20 25 30 

ccc gcg ctt ccc agg agg ttc ate tgc tec ttc cct gac tgc age gcc 
Pro Ala Leu Pro Arg Arg Phe lie Cys Ser Phe Pro Asp Cys Ser Ala 
35 40 45 

aat tac age aaa gcc tgg aag ctt gac gcg cac ctg tgc aag cac acg 
Asn Tyr Ser Lys Ala Trp Lys Leu Asp Ala His Leu Cys Lys His Thr 
50 55 60 65 

ggg gag aga cca ttt gtt tgt gac tat gaa ggg tgt ggc aag gcc ttc 
Gly Glu Arg Pro Phe Val Cys Asp Tyr Glu Gly Cys Gly Lys Ala Phe 
70 75 80 



226 



274 



322 



370 



418 



ate agg gac tac cat ctg age cgc cac att ctg act cac aca gga gaa 
lie Arg Asp Tyr His Leu Ser Arg His lie Leu Thr His Thr Gly Glu 



466 



85 90 95 



gga tgt tec ttt gtg gca aaa aca tgg acg gaa ctt ctg aaa cat gtg 
Gly Cys Ser Phe Val Ala Lys Thr Trp Thr Glu Leu Leu Lys His Val 
195 200 205 

aga gaa acc cat aaa gag gaa ata eta tgt gaa gta tgc egg aaa aca 
Arg Glu Thr His Lys Glu Glu He Leu Cys Glu Val Cys Arg Lys Thr 
210 215 220 225 

ttt aaa cgc aaa gat tac ctt aag caa cac atg aaa act cat gec cca 
Phe Lys Arg Lys Asp Tyr Leu Lys Gin His Met Lys Thr His Ala Pro 
230 235 240 

gaa agg gat gta tgt cgc tgt cca aga gaa ggc tgt gga aga acc tat 
Glu Arg Asp Val Cys Arg Cys Pro Arg Glu Gly Cys Gly Arg Thr Tyr 
245 250 255 

act act gtg ttt aat etc caa age cat ate etc tec ttc cat gag gaa 
Thr Thr Val Phe Asn Leu Gin Ser His He Leu Ser Phe His Glu Glu 
260 265 270 

age cgc cct ttt gtg tgt gaa cat get ggc tgt ggc aaa aca ttt gca 
Ser Arg Pro Phe Val Cys Glu His Ala Gly Cys Gly Lys Thr Phe Ala 
275 280 285 

atg aaa caa agt etc act agg cat get gtt gta cat gat cct gac aag 
Met Lys Gin Ser Leu Thr Arg His Ala Val Val His Asp Pro Asp Lys 
290 295 300 305 



514 



aag ccg ttt gtt tgt gca gee act ggc tgt gat caa aaa ttc aac aca 
Lys Pro Phe Val Cys Ala Ala Thr Gly Cys Asp Gin Lys Phe Asn Thr 
100 105 HO 

aaa tea aac ttg aag aaa cat ttt gaa cgc aaa cat gaa aat caa caa 
Lys Ser Asn Leu Lys Lys His Phe Glu Arg Lys His Glu Asn Gin Gin 
115 120 125 

aaa caa tat ata tgc agt ttt gaa gac tgt aag aag acc ttt aag aaa 
Lys Gin Tyr lie Cys Ser Phe Glu Asp Cys Lys Lys Thr Phe Lys Lys 
130 135 140 145 

cat cag cag ctg aaa ate cat cag tgc cag cat acc aat gaa cct eta 
His Gin Gin Leu Lys He His Gin Cys Gin His Thr Asn Glu Pro Leu 
150 155 160 

ttc aag tgt acc cag gaa gga tgt ggg aaa cac ttt gca tea ccc age 
Phe Lys Cys Thr Gin Glu Gly Cys Gly Lys His Phe Ala Ser Pro Ser 
165 170 175 

aag ctg aaa cga cat gec aag gee cac gag ggc tat gta tgt caa aaa 7 54 
Lys Leu Lys Arg His Ala Lys Ala His Glu Gly Tyr Val Cys Gin Lys 
180 185 190 



562 



610 



658 



706 



802 



850 



898 



946 



994 



1042 



1090 



aag aaa atg aag etc aaa gtc aaa aaa tct cgt gaa aaa egg agt ttg 
Lys Lys Met Lys Leu Lys Val Lys Lys Ser Arg Glu Lys Arg Ser Leu 
310 315 320 



1138 



3 



gcc tct cat etc agt gga tat ate cct ccc aaa agg aaa caa ggg caa 1186 
Ala Ser His Leu Ser Gly Tyr He Pro Pro Lys Arg Lys Gin Gly Gin 
325 330 335 

ggc tta tct ttg tgt caa aac gga gag tea ccc aac tgt gtg gaa gac 1234 
Gly Leu Ser Leu Cys Gin Asn Gly Glu Ser Pro Asn Cys Val Glu Asp 
340 345 350 

aag atg etc teg aca gtt gca gta ctt ace ctt ggc taa i 2 73 
Lys Met Leu Ser Thr Val Ala Val Leu Thr Leu Gly 
355 360 365 



<210> 2 
<211> 365 
<212> PRT 
<213> Human 



<400> 2 

Me t Asp Pro Pro 
1 

Ala Asp Ala Phe 
20 

Arg Pro Ala Leu 
35 

Ala Asn Tyr Ser 
50 



Ala Val Val Ala 

5- 

lie Ala Ala Gly 

Pro Arg Arg Phe 
40 

Lys Ala Trp Lys 
55 



Glu Ser Val Ser 
10 

Glu Ser Ser Ala 
25 

He Cys Ser Phe 



Leu Asp Ala His 
60 



Ser Leu Thr He 
15 

Pro Thr Pro Pro 
30 

Pro Asp Cys Ser 
45 

Leu Cys Lys His 



Thr Gly Glu Arg Pro Phe Val Cys 
65 70 

Phe He Arg Asp Tyr His Leu Ser 
85 

Glu Lys Pro Phe Val Cys Ala Ala 
100 

Thr Lys Ser Asn Leu Lys Lys His 
115 120 

Gin Lys Gin Tyr He Cys Ser Phe 
130 135 



Asp Tyr Glu Gly Cys Gly Lys Ala 
75 so 

Arg His He Leu Thr His Thr Gly 
90 95 

Thr Gly Cys Asp Gin Lys Phe Asn 
105 no 

Phe Glu Arg Lys His Glu Asn Gin 
125 

Glu Asp Cys Lys Lys Thr Phe Lys 
14 0 



Lys His Gin Gin 
145 

Leu Phe Lys Cys 

Ser Lys Leu Lys 
180 

Lys Gly Cys Ser 



Leu Lys He His 
150 

Thr Gin Glu Gly 
165 

Arg His Ala Lys 
Phe Val Ala Lys 



Gin Cys Gin His 
155 

Cys Gly Lys His 
170 

Ala His Glu Gly 
185 

Thr Trp Thr Glu 



Thr Asn Glu Pro 
160 

Phe Ala Ser Pro 
175 

Tyr Val Cys Gin 
190 

Leu Leu Lys His 



4 teu^ «~ 



195 200 205 

Val Arg Glu Thr His Lys Glu Glu lie Leu Cys Glu Val Cys Arg Lys 
210 215 220 

Thr Phe Lys Arg Lys Asp Tyr Leu Lys Gin His Met Lys Thr His Ala 
225 230 235 240 

Pro Glu Arg Asp Val Cys Arg Cys Pro Arg Glu Gly Cys Gly Arg Thr 
245 250 255 

Tyr Thr Thr Val Phe Asn Leu Gin Ser His lie Leu Ser Phe His Glu 
260 265 270 

Glu Ser Arg Pro Phe Val Cys Glu His Ala Gly Cys Gly Lys Thr Phe 
275 280 285 

Ala Met Lys Gin Ser Leu Thr Arg His Ala Val Val His Asp Pro Asp 
290 295 300 

Lys Lys Lys Met Lys Leu Lys Val Lys Lys Ser Arg Glu Lys Arg Ser 
305 310 315 320 

Leu Ala Ser His Leu Ser Gly Tyr lie Pro Pro Lys Arg Lys Gin Gly 
325 330 335 

Gin Gly Leu Ser Leu Cys Gin Asn Gly Glu Ser Pro Asn Cys Val Glu 
340 345 350 

Asp Lys Met Leu Ser Thr Val Ala Val Leu Thr Leu Gly 
355 360 365 



<210> 3 
<211> 1273 
<212> ADN 
<213> Human 

<400> 3 

atgcgcagca gcggcgccga cgcggggcgg tgcctggtga ccgcgcgcgc tcccggaagt 60 

gtgccggcgt cgcgcgaagg ttcagcaggg agccgtgggc cgggcgcgcc ggttcccggc 12 0 

acgtgtctcg gcacgtggca gcgcgcctgg ccctgggctt ggaggcgccg gcgccctgga 18 0 

tccgccggcc gtggtcgccg agtcggtgtc gtccttgacc atcgccgacg cgttcattgc 24 0 

agccggcgag agctcagctc cgaccccgcc gcgccccgcg cttcccagga ggttcatctg 300 

ctccttccct gactgcagcg ccaattacag caaagcctgg aagcttgacg cgcacctgtg 360 

caagcacacg ggggagagac catttgtttg tgactatgaa gggtgtggca aggccttcat 42 0 

cagggactac catctgagcc gccacattct gactcacaca ggagaaaagc cgtttgtttg 480 

tgcagccact ggctgtgatc aaaaattcaa cacaaaatca aacttgaaga aacattttga 54 0 



acgcaaacat gaaaatcaac aaaaacaata 
ctttaagaaa catcagcagc tgaaaatcca 
caagtgtacc caggaaggat gtgggaaaca 
tgccaaggcc cacgagggct atgtatgtca 
gacggaactt ctgaaacatg tgagagaaac 
ccggaaaaca tttaaacgca aagattacct 
aagggatgta tgtcgctgtc caagagaagg 
tctccaaagc catatcctct ccttccatga 
tggctgtggc aaaacatttg caatgaaaca 
tcctgacaag aagaaaatga agctcaaagt 
ctctcatctc agtggatata tccctcccaa 
tcaaaacgga gagtcaccca actgtgtgga 
tacccttggc taa 

<210> 4 
<211> 1213 
<212> ADN 
<213> Human 

<400> 4 

gtgccggcgc cgcgcgaagg ttcagcaggg 
acgtgtctcg gcacgtggca gcgcgcctgg 
tccgccggcc gtggtcgccg agtcggtgtc 
agccggcgag agctcagctc cgaccccgcc 
ctccttccct gactgcagcg ccaattacag 
caagcacacg ggggagagac catttgtttg 
cagggactac catctgagcc gccacattct 
tgcagccact ggctgtgatc aaaaattcaa 
acgcaaacat gaaaatcaac aaaaacaata 
ctttaagaaa catcagcagc tgaaaatcca 
caagtgtacc caggaaggat gtgggaaaca 
tgccaaggcc cacgagggct atgtatgtca 



5 tcaiiii 

tatatgcagt tttgaagact gtaagaagac 600 
tcagtgccag cataccaatg aacctctatt 660 
ctttgcatca cccagcaagc tgaaacgaca 720 
aaaaggatgt tcctttgtgg caaaaacatg 780 
ccataaagag gaaatactat gtgaagtatg 84 0 
taagcaacac atgaaaactc atgccccaga 90 0 
ctgtggaaga acctatacta ctgtgtttaa 960 
ggaaagccgc ccttttgtgt gtgaacatgc 102 0 
aagtctcact aggcatgctg ttgtacatga 1080 
caaaaaatct cgtgaaaaac ggagtttggc 114 0 
aaggaaacaa gggcaaggct tatctttgtg 12 0 0 
agacaagatg ctctcgacag ttgcagtact 1260 

1273 



agccgtgggc cgggcgcgcc ggttcccggc 60 
ccctgggctt ggaggcgccg gcgccctgga 120 
gtccttgacc atcgccgacg cgttcattgc 180 
gcgccccgcg cttcccagga ggttcatctg 240 
caaagcctgg aagcttgacg cgcacctgtg 300 
tgactatgaa gggtgtggca aggccttcat 360 
gactcacaca ggagaaaagc cgtttgtttg 42 0 
cacaaaatca aacttgaaga aacattttga 480 
tatatgcagt tttgaagact gtaagaagac 54 0 
tcagtgccag cataccaatg aacctctatt 600 
ctttgcatca cccagcaagc tgaaacgaca 660 
aaaaggatgt tcctttgtgg caaaaacatg 720 



a ***** 

gacggaactt ctgaaacatg tgagagaaac ccataaagag gaaatactat gtgaagtatg 780 

ccggaaaaca tttaaacgca aagattacct taagcaacac atgaaaactc atgccccaga 840 

aagggatgta tgtcgctgtc caagagaagg ctgtggaaga acctatacta ctgtgtttaa 900 

tctccaaagc catatcctct ccttccatga ggaaagccgc ccttttgtgt gtgaacatgc 960 

tggctgtggc aaaacatttg caatgaaaca aagtctcact aggcatgctg ttgtacatga 1020 

tcctgacaag aagaaaatga agctcaaagt caaaaaatct cgtgaaaaac ggagtttggc 1080 

ctctcatctc agtggatata tccctcccaa aaggaaacaa gggcaaggct tatctttgtg 114 0 

tcaaaacgga gagtcaccca actgtgtgga agacaagatg ctctcgacag ttgcagtact 1200 
tacccttggc taa 1213 



<210> 5 
<211> 34 
<212> ADN 
<213> Human 

<400> 5 

cggggtacca aaaatgcgca gcagcggcgc cgac 34 



<210> 6 
<211> 21 
<212> ADN 
<213> Human 

<400> 6 

tccttccctg actgcagcgc c 21 



<210> 7 
<211> 20 
<212> ADM 
<213> Human 

<400> 7 

tgcacaggtg cgcgtcaagc 2 0 



<210> 8 
<211> 20 
<212> ADN 
<213> Human 

<400> 8 

cacaaacaaa tggtctctcc 20 



Ac*** 



<210> 9 
<211> 30 





1 



<212> ADN 



<213> Human 
<400> 9 

cggtctagat tagccaaggg taagtactgc 

<210> 10 
<211> 30 
<212> ADN 
<213> Human 

<400> 10 

cctcccgggg ccaagggtaa gtactgcaac 
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que facteurs impliques dans le contr61e de la transcription 
de 1'ARN 5S. 

Le gene de la presente invention peut ainsi etre utilise 
pour la recherche d' anomalies au niveau de la transcription 
5 des genes et notamment pour 1 ' identification de maladies 

her§ditaires ou pour 1 ' etude de maladies mettant en cause les 
facteurs de regulation et notamment la proteine codee par 
htf IIIA. 

Le gene de la presente invention peut egalement etre 

10 utilise pour le traitement de certaines maladies a travers le 
controle de la transcription ou dans 1' analyse de la 
pathogenie de ces maladies. 

La presente invention prevoit done une utilisation du 
gene htf IIIA de la presente invention et de la proteine 

15 hTFIIIA de la presente invention, notamment pour contribuer a 
la comprehension du mecanisme de la transcription chez 
l'homme et pour contribuer Egalement a la comprehension, au 
diagnostic et au traitement de maladies liees a un 
dereglement du mecanisme de transcription. Ainsi htf IIIA et 

20 la proteine hTFIIIA pourraient etre utilises dans le 

diagnostic ou 1 ' identification de maladies hereditaires comme 
certains cancers ou d'autres maladies resultant d'un controle 
anormal de la transcription. Ces facteurs peuvent Egalement 
etre utiles dans 1 ' analyse des mecanismes de regulation de la 

25 transcription. 

La presente invention a ainsi pour objet 1 ' utilisation 
de la sequence d'ADN du gene du facteur de transcription 
humain htf IIIA ou du polypeptide ayant la fonction de facteur 
de transcription humain code" par ce gene ainsi qu' il est 

30 defini ci-dessus pour la preparation de compositions utiles 
pour le diagnostic ou le traitement de maladies liees a un 
desordre dans le controle de la transcription. 
De telles compositions sont preparees dans les conditions 
usuelles connues de l'homme du metier. 

35 La presente invention a plus pr^cisement pour objet 

1 ' utilisation telle que d^finie ci-dessus pour laquelle la 
maladie concerned est le cancer. Les figures 1 a 5 ci-apres 
pre"sentent les illustrations suivantes . La figure 1 
repr^sente la comparaison de la proteine hTFIIIA 



27 feoilk r 

REVENDICATIONS 

1) Sequence d'ADN du gene htfUIA codant pour une proteine 
ayant la fonction biologique du facteur de transcription 
humain hTFIIIA. 
5 2) Sequence d'ADN du gene htfUIA du facteur de 

transcription humain hTFIIIA selon la revendication 1 
codant pour la sequence d'acides amines SEQ ID N°2. 
3) Sequence d'ADN du gene htfUIA selon la revendication 1 
ou 2 contenant la sequence de nucleotides SEQ ID N°3 

10 4) Sequence d'ADN du gene htfUIA selon les revendications 1 
a 3 contenant la sequence de nucleotides SEQ ID N°4 . 
5) Sequence d'ADN selon la revendication 4 ayant la sequence 
commencant au nucleotide 176 et se terminant au nucleotide 
1270 de SEQ ID N°3 . 

15 6) Sequence d'ADN codant pour le facteur de transcription 

humain hTFIIIA selon les revendications 1 a 5 ainsi que les 
sequences d'ADN qui hybrident avec celle-ci et/ou presentent 
des homologies signif icat ives avec cette sequence ou des 
fragments de celle-ci et qui codent pour une proteine ayant 
2 0 la meme fonction. 

7) Sequence d'ADN selon les revendications 1 a 6 comprenant 

des modifications introduites par suppression, insertion 
et/ou substitution d'au moins un nucleotide codant pour une 
proteine ayant la meme activite biologique que le facteur de 

2 5 transcription humain hTFIIIA. 

8) Sequence d'ADN selon l'une des revendications 1 a 7 ainsi 
que les sequences d'ADN similaires qui ont une homologie de 
sequence nucleotidique d'au moins 50 % ou au moins 60 % et de 
preference au moins 70 % avec ladite sequence d'ADN. 

30 9) Sequence d'ADN selon l'une des revendications 1 a 8 ainsi 
que les sequences d'ADN similaires qui codent pour une 
proteine dont la sequence en AA a une homologie d'au moins 
40 % et notamment de 45 % ou d'au moins 50 %, plutot au 
moins 60 % et de preference au moins 70 % avec la sequence 

3 5 en AA codee par ladite sequence d'ADN. 
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10) Polypeptide ayant la fonction de facteur de transcrip- 
tion humain hTFIIIA et ayant la sequence en acides amines 
SEQ ID N°2 codee par la sequence d'ADN selon l'une des 
revendications 1 a 9 et les analogues de ce polypeptide. 
5 11) Procede de preparation de la proteine recombinante 
hTFIIIA ayant la sequence d 1 acides amines SEQ ID N°2 
comprenant 1' expression de la sequence d'ADN selon l'une 
des revendications 1 a 9 dans un note approprie puis 
l'isolement et la purification de ladite proteine 
10 recombinante 

12) Vecteur d' expression contenant la sequence d'ADN selon 

l'une des revendications 3 a 9. 

13) Cellule note transformee avec un vecteur selon la 

revendication 12 
15 14) Plasmide depose a la CNCM sous le numero 1-2071 

15) Utilisation de la sequence d'ADN du gene htfUIA selon 
l'une des revendications 1 a 9 ou du polypeptide ayant la 
fonction de facteur de transcription humain codg par ladite 
sequence d'ADN et tel que defini a la revendication 10 pour 

20 la preparation de compositions utiles pour le diagnostic ou 
le traitement de maladies liees a un desordre dans le 
controle de la transcription. 

16) Utilisation selon la revendication 15 pour laquelle la 
maladie concernee est le cancer. 
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1 MDPPAVVAESVSSLTIADAFIAAGESSAPTPPRPALPRRFICSFPDCSAN SO 

IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIH 
1 . . PPAWAESVSSLTIADAFIAAGESSAPTPPRPALPRRFICSFPDCSAN 

51 YSKAWKIiDAHLCKHTGERPFVCDYEGCGKAFIM>YHLSRHILTHTGEKPF 100 

IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIMIIMIII 

49 YSKAWKIiDAHLCKHTGERPFVCDYEGCGKAFIRDYHLSRHILTHTGEKPF 98 
101 VCAATGCDQKFNTKSNLKKHFERKHENQQKQ Y I CS FEDCKKTFKKHQQLK 150 

I'll IIINIIIIIIIIIIIIIIIIIIIIIIIIIIMIIIIIIIIllii 

99 VCAANGCDQKFNTKS NLKKHFERKHENQQKQ YI CS FEDCKKTFKKHQQLK 148 
151 IHQCQHTNEPLFKCTQEGCGKHFAS PSKLKRHAKAHEGYVCQKGCS FVAK 200 

iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiini 

149 IHQCQHTNEPLFKCTQEGCGKHFAS PS KLKRHAKAHEGYVCQKGCS FVAK 198 

201 TWTELIJCHVRETHKEE ILCEVCRKTF1CRKD YLKQHMKTHAPERDV 2 SO 

, M JJi llli| llllllllllllll||||||||||||M||||||||||||,| 

199 TWTELLKHVRETHKEEILCEVCRKTFKRKDYLKQHMKTHAPERDVCRCPR 24 8 

EGCGRTYTTVFNLQSHILSFHEESRPFVCEHAGCGKTFAMKQSLTRHAVV 

'I' N I II Mill II I II [Mill M Ml II I III! | III 1 1 || || 1 1 1 I 

EGCGRTYTTVFNLQSHILSFHEESRPFVCEHAGCGKTFAMKQSLTRHAVV 



251 



249 



300 



298 



3 01 HDPDKKKMKLKVKKSREKRSI^ASHLSGYIPPKRKQ/SQGLSLCQNGESPNC 350 

iiiiNiiiniiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiim 

299 HDPDKKKMKIJCVKKSREKRSLASIILSGYIPPK^^ 348 
351 VEDKMLS TVAVLTLG 365 

II I II II 1 1 1 ill 1 1 

34 9 VEDKMLS TVAVLTLG 3 63 
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1 MDPPAVVAESVSSLTIADAFIAAGESSAPTPPRPALPRRFIC 42 

:|[ llllll llllllll 11 IIMMilillllllll III Ml 

51 PGIiGGAGALDPPAWAESVSSLTIADAFIAAGESSAPTPPRPALPRRFIC 100 
43 S FPDC S ANY SKAWKLDAHLCKHTGERP FVCD YEGCGKAFI RDYHLS RHI L 92 

I j I |] IN I [MIIMI IIIIMII1 I IMIMIMI1III1I1III III 

101 S FPDCSANYS KAWKLDAHLCKHTGERP FVCD YEGCGKAFI RDYHLSRHIL 150 
93 THTGEKPFVCAATGCDQKFNTKSNLKKHFERKHENQQKQYICSFEDCKKT 142 

iiiiiiiiiiii mi iiiiiiii] i iiinii Miiiiiiii iii in 

151 THTGEKPFVCAANGCDQKFNTKSNLKKHFERKHENQQKQYICSFEDCKKT 200 
143 FKKHQQLKIHQCQHTNEPLFKCTQEGCGKHFASPSKLKRHAKAHEGYVCQ 192 

I ! I II III III IMII MM INN I MIIMI llllll INI Ml II I 

201 FKKHQQLKIHQCQNTNEPLFKCTQEGCGKHFASPSKLKRHAKAHEGYVCQ 250 
193 KGC S FVAKTWTELLKHVRE THREE I LC EVCRKTFKRKD YLKQHMKTHAPE 242 

IIIIIIIIIIIIIIIIIIMIIMIIIIIIIIIMilMIIIIIMI III 

251 KGCSFVAKTWTELLKHVRETHKEEILCEVCRKTFKRKD YLKQHMKTHAPE 3 00 
243 RDVCRCPREGCGRTYTTVFNLQSHILSFHEESRPFVCEHAGCGKTFAMKQ 292 

ii iiiiii iiiiii mini ii ii in iiiiiiii ii n 1 1 ii i ii in 

301 RDVCRCPREGCGRTYTTVFNLQSHI LS FHEESRPFVCEHAGCGKTFAMKQ 350 
293 S LTRHAVVHDPDKKKMKLKVKKS RE KRS LASHLS G YI P PKRKQGQGL SLC 342 

1 1 1 II I! Ml I III II I II 1 1 M II 1 1 lllllllllllll 

351 SLTRHAVVHDPDKKKMKLKVKKSREKREFGLSSQWIYPPKRKQGQGLSLC 4 00 
343 QNGES PNCVEDKMLS TVAVLTLG 365 

i m m ii i iiniini I I II II 

401 QNGES PNCVEDKMLSTVAVLTLG 423 
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51 PGLGGAGALDPPAWAES VS S LT IADAFIAAGES SAPTPPRPALPRRFIC 100 

IlillllllllllllllllllMllllliiMiiiiiiii 

1 PPAWAESVSSLTIADAFIAAGESSAPTPPRPALPRRFIC 40 



101 



S FPDC S ANYS KAWKLDAHLCKHTGERP FVCD YEGCGKAF I RD YHLS RHI L ISO 

iiiiiiiiiiMiiiiiiiiiiiiiiiiiiiiiiiiiiiHiini,,,, 

41 SFPDCSANYSKAWKLDAHLCKHTGERPFVCDYEGCGKAFIRDYHLSRHIL 90 
151 THTGEKPFVCAANGC3DQKFOTKSNLKKHFERKHENQQKQYI CSFEDCKKT 200 

' NIMH llllllllll HIM IIMlllHiii imiii |, f | |,||, 

91 THTGEKPFVCAANGCDQKFNTKSNLKKHFERKHENQQKQYICSFEDCKKT 140 
201 FKKHMLKIHQCQimJEPLFKCTQEGCGKHFASPSKLiaiHAKAHEGWCQ 250 

i ii i in i ii iii-iii I HI I (III I Mill III II I I || || | | || in 

141 FKKHQQLKIHQCQHTNE PLFKCTQEGCGKHFAS PS KLKRHAKAHEGYVCQ 190 
251 KGCS FVAKTWTELLKHVRETHKEE I LCEVCRKTFKRKD YIjKQHMKTHAPE 300 

IINIIIIIIIIIIIIIIIIIIIIIIIlllliilllllllllllllllll 

191 KGCSFVAKTWTELLKHVTIETHKEEILCEVCRKTFKRKDYI^QHMKTHAPE 240 
301 RDVCRCPREGCG RTYTTVFNLQS HI LS FHEE S RPFVCEHAGCGKTFAMKO 350 

IIIIIIIIIIINlllllllllllllllllllllllllllllllllllll 

241 RDVCRCPREGCGRTYTTVFNLQSHILSFHEESRPFVCEHAGCGKTFAMKQ 290 

351 SLTRHAVVHDPDKKKMKLKVKKSREKREFGLSSQWIYPPKRKQGQGLSLC 400 

HNIIIIIIIIIIIIIIIINIIIII I I II II 111) | | | 

291 SLTRHAVVHDPDKKKMKLKVKKSREKRSIASHLSGYIPPKRKQGOGLSLC 340 

401 QNGESPNCVEDKMLSTVAVLTLG 423 

III I KM I III Mill III I II 

341 QNGESPNCVEDKMLSTVAVLTLG 363 
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4 / 14 feuflfe rectify 



1 CCGCCGGCCGTGGTCGCCGAGTCGGTGTCGTCCTTGACCATCGCCGACGC 50 
1PPAVVAESVSSLTIADA 17 



5 1 GTTCATTGCAGCCGGCGAGAGCTCAGCTCCGACCCCGCCGCGCCCCGCGC 100 

18 FIAAGES SAPT PPRPAL 34 

"■*&-£">. 

X. .101 'TO 150- f^Mf. 

"'"' 35" ' P' R R F.' : i" C S F P ; DciCOs A N Y ; . S- 50 



fc-lr .. -A. ,1, - ^-u^M^.x-.,. .fv I; ' .• -'|#| 

3 £ 51 • AAAGCCTGGAAG^TTGAGGCGCACCTGTG 1 200 : •• . . . >$ik 8 

' 51 K A W K Ii D A H L C K ' H T G E R P 67 



201 ATTTGTTTGTGACTATGAAGGGTGTGGCAAGGCGTTCATCAGGGACTACC 250 
:68 F V C D Y E G C G K -A ?F I R D Y H 84 



251 ATCTGAGCCGCCACATTCTGACTCACACAGGAGAAAAGCCGTTTGTTTGT 3 00 
85 LSRHILTHT'GEKPFVC 100 



3 01 GCAGCCAATGGCTGTGATCAAAAATTCAACACAAAAT CAAACTTGAAGAA 3 5 0 
101 AANGCDQKFNTKSNLKK 117 



3 51 ACATTTTGAACG CAAACATGAAAATCAACAAAAACAATATATATGCAGTT 400 
118 HFERKHENQQKQYICSF 134 



4 01 TTGAAGACTGTAAGAAGACCTTTAAGAAACATCAGCAGCTGAAAATCCAT 450 
135 EDCKKTFKKHQQLKIH 150 



451 C AGTGC CAGCATAC CAATGAACCTCTATT CAAGTGTACCCAGG AAGG ATG 500 
151 QCQHTNEPLFKCTQEGC 167 



5 01 TGGGAAACACTTTGCATCACCCAGCAAGCTGAAACGACATGCCAAGGCCC 550 
168 GKHFAS PSKLKRHAKAH 184 



551 ACGAGGGCTATGTATGTCAAAAAGGATGTTCCTTTGTGGCAAAAACATGG 600 
185 EGYVCQKGCS FVAKTW 200 



601 ACGGAACTTCTGAAACATGTGAGAGAAACCCATAAAGAGGAAATACTATG 650 
201 TELLKHVRETHKEEILC 217 
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recti 



651 TG AAGT ATG C C GGAAAAC ATTT AAACG CAAAG ATT AC C TT AAG CAACACA 700 

218 EVCRKTFKRKDYLKQHM 234 

701 TGAAAACTCATGCCCCAGAAAGGGATGTATGTCGCTGTCCAAGAGAAGGC 750 

235 KTHAPERDVCRCPREG 250 



751 TGTGGAAGAAC CTATACAACTGTGTTT AATCTC CAAAGCCATATC CTCTC 800 

251 C G R TY T T V FNL Q S H I L S 267 

801 CTTCCATGAGGAAAGCCGCCCTTTTGTGTGTGAACATGCTGGCTGTGGCA 850 

268 FHEBSRPPVCEHAG'CGK 284 



851 AAACATTTGCAATGAAACAAAGTCTCACTAGG CATGCTGTTGTACATGAT 900 
285 TFAMKQSLTRHAVVHD 300 



901 C CTG ACAAGAAGAAAATG AAGCTCAAAGTCAAAAAAT CTCGTGAAAAACG 950 

301 P D K KKM K L KVKK S R E K R 317 

951 GAG TTTGG CCTCTCATCTCAGTGGATATATCC CTCC CAAAAGGAAAC AAG 1000 

318 S LASHLSGYIPPKR K QG 3 34 



1001 GGCAAGGCTTATCTTTGTGTCAAAACGGAGAGTCACCCAACTGTGTGGAA 1050 
33 5 QGLSLCQNGES PNC VE 3 50 



1051 GACAAGATGCTCf CGACAGTTGCAGTACTTACCCTTGGCTAAGAACTGCA 1100 
351 DKMLS. TVAVLTLQ+ 364 



1101 CTG CTTTG TTTAAAGGACTGCAGACC AAGGAGCGAGCTTTCTCTCAGAGC 1150 
1151 ATGCTTT TCTTTATTAAAATTAC 1173 
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(entile 



1 ATGCGCGATCTCCCGGAGCATGCGCAGCAGCGGCGCCGACGCGGGGCGGT SO 
1 MRS SGADAGRC 11 



5 1 GCCTGGTGACCGCGCGCGCTCCCGGAAGTGTGCCGGCGTCGCGCGAAGGT 100 
12 LVTARAPGSVPASREG 27 



101 TCAGCAGGGAGCCGTGGGCCGGGCGCGCGGTTCCCGGCACGTGTCTCGGC 150 
28 SAGSRGPGARFPARVSA 44 



1 S 1 ACGTGGCAGCGCGCCTGGCCCTGGGCTTGGAGGCGCCGGCGCCCTGGATC 200 
45 RGSAPG PGLGGAGALDP 61 



2 01 CGCCGGCCGTGGTCGCCGAGTCGGTGTCGTCCTTGACCATCGCCGACGCG 250 
62 PAVVAESVSSLTIADA 77 



251 TTCATTGCAGCCGGCGAGAGCTCAGCTCCGACCCCGCCGCGCCCCGCGCT 300 
78FIAAGESSAPTPPRPAL 94 



3 01 TCCCAGGAGGTTCATCTGCTCCTTCCCTGACTGCAGCGCCAATTACAGCA 350 

95 PRRFICS FPDCSANYS K 111 

3 51 AAGCCTGGAAGCTTGACGCGCACCTGTGCAAGCACACGGGGGAGAGACCA 400 

112 AWKLDAHLCKHTGERP 127 



4 01 TTTGTTTGTGACTATGAAGGGTGTGGCAAGGCCTTCATCAGGGACTACCA 450 
128 FVCDYEGCGKAFIRDYH 144 



451 TCTGAGCCGCCACATTCTGACTCACACAGGAGAAAAGCCGTTTGTTTGTG 500 
145 LSRHILTHTGEKPFVCA 161 



5 01 CAGCCAATGGCTGTGATCAAAAATTCAACACAAAATCAAACTTGAAGAAA 55 0 
162 ANGCDQKFNTKSNLKK 177 



551 CATTTTGAACGCAAAGATGAAAATCAACAAA 600 
178 HFERKHENQQKQYICS F 194 



601 TGAAGACTGTAAGAAGACCTTTAAGAAACATCAGCAGCTGAAAATCCATC 65 0 

195 EDCKKTFKKHQQLKIHQ 211 

651 AGTGCC AG AATACC AATGAACCTCTAT TCAAGTGTAC CCAGGAAGGATGT 700 

212 CQNTNE PLFKCTQEGC 227 
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701 GGGAAACACTTTGCATCACCCAGCAAGCTGAAACGACATGCCAAGGCCCA 75 0 
228 GKHFASPSKLKRHAKAH 244 



751 C GAGGG CT ATG T ATGT CAAAAAGGATG TT C C T TTGTG GCAAAAACATGGA 800 
245 EG YVCQKGCS FVAKTWT 261 



801 CGGAACTTCTGAAACATGTGAGAGAAACCCATAAAGAGGAAATACTATGT 850 
262 ELLKHVRETHKEEILC 277 



851 GAAGTATGC CGG AAAAC ATTTAAACGCAAAGATTAC CTTAAGCAACACAT 900 
278 EVCRKTFKRKDYLKQHM 294 



901 GAAAACT CATG C C C CAG AAAGGG ATGTATGT C G CTGT C CAAG AGAAGGCT 950 
295 KTHAPERDVCRCPREGC 31X 



951 GTGGAAGAACCTATACAACTGTGTTTAATCTCCAAAGCCATATCCTCTCC 1000 

312 GRTYTTVFNLQSHILS 327 

1001 TTCCATGAGGAAAGCCGCCCTTTTGTGTGTGAACATGCTGGCTGTGGCAA 1050 

328 FHEESRPFVCEHAGCGK 344 



1051 AACATTTGCAATGAAACAAAGTCTCACTAGGCATGCTGTTGTACATGATC 1100 
345 TFAMKQS LTRH AVVHDP 361 



1101 CTG ACAAG AAGAAAATGAAGCTCAAAGTCAAAAAATCTCGTG AAAAACGG 1150 
362 DKKKMKLKVKKS REKR 377 



1 1 S 1 GAG TTTGGC CT C T CAT CTCAGTGGAT AT ATC C T C C CAAAAGG AAACAAGG 1200 
378 EFGLS SQWIYP PKRKQG 3 94 



1201 GC AAGG CTT ATC TTTG TGTCAAAACGG AGAGT CAC C CAAC TG TGTGG AAG 1250 
395 QGLS LCQNGES PNCVED 411 



1251 ACAAGATG CT CT C GACAGTTG C AGT AC TTAC C CTTGGCTAAG AAC TG CAC 1300 
412 KMLSTVAVLTLG* 424 



1301 TGCTTTGTTTAAAGGACTGCAGACCAAGGAGTCGAGCTTTCTCTCAGAGC 1350 



ATG CTTTT CTTT ATT AAAATT ACTG ATG CAG AAAAAAAAAAAAAAAAAA 1399 
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LI STAGE DE SEQUENCE 

<110> Hoechst Marion Rous s el 

<120> Gene humain htfUIA et la proteine codee hTFIIIA. 

<130> 9823seq 

<140> 
<141> 

<160> 10 

<170> Patentln Vers. 2.0 

<210> 1 
<211> 1273 
<212> ADN 
<213> Human 

<220> 
<221> CDS 

<222> (176) . . (1270) 
<400> 1 

atgcgcagca gcggcgccga cgcggggcgg tgcctggtga ccgcgcgcgc tcccggaagt 60 

gtgccggcgt cgcgcgaagg ttcagcaggg agccgtgggc cgggcgcgcc ggttcccggc 120 

acgtgtctcg gcacgtggca gcgcgcctgg ccctgggctt ggaggcgccg gcgcc ctg 178 

Met 
1 

gat ccg ccg gcc gtg gtc gcc gag teg gtg teg tec ttg ace ate gec 22 6 
Asp Pro Pro Ala Val Val Ala Glu Ser Val Ser Ser Leu Thr lie Ala 
5 10 15 

gac gcg ttc att gca gcc ggc gag age tea get ccg acc ccg ccg cgc 274 
Asp Ala Phe lie Ala Ala Gly Glu Ser Ser Ala Pro Thr Pro Pro Arg 
20 25 30 

ccc gcg ctt ccc agg agg ttc ate tgc tec ttc cct gac tgc age gcc 322 
Pro Ala Leu Pro Arg Arg Phe lie Cys Ser Phe Pro Asp Cys Ser Ala 
35 40 45 

aat tac age aaa gcc tgg aag ctt gac gcg cac ctg tgc aag cac acg 370 
Asn Tyr Ser Lys Ala Trp Lys Leu Asp Ala His Leu Cys Lys His Thr 
50 55 60 65 

ggg gag aga cca ttt gtt tgt gac tat gaa ggg tgt ggc aag gcc ttc 418 
Gly Glu Arg Pro Phe Val Cys Asp Tyr Glu Gly Cys Gly Lys Ala Phe 
70 75 80 

ate agg gac tac cat ctg age cgc cac att ctg act cac aca gga gaa 466 
lie Arg Asp Tyr His Leu Ser Arg His lie Leu Thr His Thr Gly Glu 




9/14 teaflle -a** 

85 90 95 

aag ccg ttt gtt tgt gca gcc act ggc tgt gat caa aaa ttc aac aca 514 
Lys Pro Phe Val Cys Ala Ala Thr Gly Cys Asp Gin Lys Phe Asn Thr 
100 105 no 

aaa tea aac ttg aag aaa cat ttt gaa cgc aaa cat gaa aat caa caa 562 
Lys Ser Asn Leu Lys Lys His Phe Glu Arg Lys His Glu Asn Gin Gin 
11S 120 125 

aaa caa tat ata tgc agt ttt gaa gac tgt aag aag acc ttt aag aaa 610 
Lys Gin Tyr lie Cys Ser Phe Glu Asp Cys Lys Lys Thr Phe Lys Lys 
130 135 140 145 



cat cag cag ctg aaa ate cat cag tgc cag cat acc aat gaa cct eta 658 

His Gin Gin Leu Lys lie His Gin Cys Gin His Thr Asn Glu Pro Leu 
150 155 160 

ttc aag tgt acc cag gaa gga tgt ggg aaa cac ttt gca tea ccc age 706 

Phe Lys Cys Thr Gin Glu Gly Cys Gly Lys His Phe Ala Ser Pro Ser 
165 170 175 



aag ctg aaa cga cat gcc aag gcc cac gag ggc tat gta tgt caa aaa 754 
Lys Leu Lys Arg His Ala Lys Ala His Glu Gly Tyr Val Cys Gin Lys 
180 185 190 

gga tgt tec ttt gtg gca aaa aca tgg acg gaa ctt ctg aaa cat gtg 802 
Gly Cys Ser Phe Val Ala Lys Thr Trp Thr Glu Leu Leu Lys His Val 
195 200 205 



aga gaa acc cat aaa gag gaa ata eta tgt gaa gta tgc egg aaa aca 85 0 
Arg Glu Thr His Lys Glu Glu lie Leu Cys Glu Val Cys Arg Lys Thr 
210 215 220 225 



ttt aaa cgc aaa gat tac ctt aag caa cac atg aaa act cat gcc cca 898 

Phe Lys Arg Lys Asp Tyr Leu Lys Gin His Met Lys Thr His Ala Pro 
230 235 240 

gaa agg gat gta tgt cgc tgt cca aga gaa ggc tgt gga aga acc tat 94 6 

Glu Arg Asp Val Cys Arg Cys Pro Arg Glu Gly Cys Gly Arg Thr Tyr 
245 250 255 



act act gtg ttt aat etc caa age cat ate etc tec ttc cat gag gaa 994 
Thr Thr Val Phe Asn Leu Gin Ser His lie Leu Ser Phe His Glu Glu 
260 265 270 



age cgc cct ttt gtg tgt gaa cat get ggc tgt ggc aaa aca ttt gca 1042 

Ser Arg Pro Phe Val Cys Glu His Ala Gly Cys Gly Lys Thr Phe Ala 
275 280 285 

atg aaa caa agt etc act agg cat get gtt gta cat gat cct gac aag 1090 

Met Lys Gin Ser Leu Thr Arg His Ala Val Val His Asp Pro Asp Lys 

290 295 300 - 305 

aag aaa atg aag etc aaa gtc aaa aaa tct cgt gaa aaa egg agt ttg 113 8 

Lys Lys Met Lys Leu Lys Val Lys Lys Ser Arg Glu Lys Arg Ser Leu 

310 315 320 



1G /* 4 teaflle reed*** 



gcc tct cat etc agt gga tat ate cct ccc aaa agg aaa caa ggg caa 1186 
Ala Ser His Leu Ser Gly Tyr He Pro Pro Lys Arg Lys Gin Gly Gin 
325 330 335 

ggc tta tct ttg tgt caa aac gga gag tea ccc aac tgt gtg gaa gac 1234 
Gly Leu Ser Leu Cys Gin Asn Gly Glu Ser Pro Asn Cys Val Glu Asp 

340 -aytc ^r-„ 



340 345 350 

aag atg etc teg aca gtt gca gta ctt ace ctt ggc taa 
Lys Met Leu Ser Thr Val Ala Val Leu Thr Leu Gly 
355 360 365 



<210> 2 
<211> 365 
<212> PRT 
<213> Human 

<400> 2 

Met Asp Pro Pro Ala Val Val Ala Glu Ser Val Ser Ser Leu Thr He 
15 10 15 

Ala Asp Ala Phe He Ala Ala Gly Glu Ser Ser Ala Pro Thr Pro Pro 
20 25 30 

Arg Pro Ala Leu Pro Arg Arg Phe He Cys Ser Phe Pro Asp Cys Ser 
35 40 45 

Ala Asn Tyr Ser Lys Ala Trp Lys Leu Asp Ala His Leu Cys Lys His 
50 55 €0 

Thr Gly Glu Arg Pro Phe Val Cys Asp Tyr Glu Gly Cys Gly Lys Ala 
65 7 ° 75 eo 

Phe He Arg Asp Tyr His Leu Ser Arg His He Leu Thr His Thr Gly 
85 90 95 

Glu Lys Pro Phe Val Cys Ala Ala Thr Gly Cys Asp Gin Lys Phe Asn 
1°° 105 no 

Thr Lys Ser Asn Leu Lys Lys His Phe Glu Arg Lys His Glu Asn Gin 
115 120 125 

Gin Lys Gin Tyr He Cys Ser Phe Glu Asp Cys Lys Lys Thr Phe Lys 
130 135 140 

Lys His Gin Gin Leu Lys He His Gin Cys Gin His Thr Asn Glu Pro 
145 150 155 i 6 o 

Leu Phe Lys Cys Thr Gin Glu Gly Cys Gly Lys His Phe Ala Ser Pro 
165 170 175 

Ser Lys Leu Lys Arg His Ala Lys Ala His Glu Gly Tyr Val Cys Gin 
18° 185 iso 

Lys Gly Cys Sex Phe Val Ala Lys Thr Trp Thr Glu Leu Leu Lys His 



1273 
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195 200 205 

Val Arg Glu Thr His Lys Glu Glu lie Leu Cys Glu Val Cys Arg Lys 
210 215 220 

Thr Phe Lys Arg Lys Asp Tyr Leu Lys Gin His Met Lys Thr His Ala 
225 230 235 240 

Pro Glu Arg Asp Val Cys Arg Cys Pro Arg Glu Gly Cys Gly Arg Thr 
245 250 255 

Tyr Thr Thr Val Phe Asn Leu Gin Ser His lie Leu Ser Phe His Glu 
260 265 270 

Glu Ser Arg Pro Phe Val Cys Glu His Ala Gly Cys Gly Lys Thr Phe 
275 280 285 

Ala Met Lys Gin Ser Leu Thr Arg His Ala Val Val His Asp Pro Asp 
290 295 300 

Lys Lys Lys Met Lys Leu Lys Val Lys Lys Ser Arg Glu Lys Arg Ser 
305 310 315 320 

Leu Ala Ser His Leu Ser Gly Tyr lie Pro Pro Lys Arg Lys Gin Gly 
325 330 335 

Gin Gly Leu Ser Leu Cys Gin Asn Gly Glu Ser Pro Asn Cys Val Glu 
340 345 350 

Asp Lys Met Leu Ser Thr Val Ala Val Leu Thr Leu Gly 
355 360 365 



<210> 3 
<211> 1273 
<212> ADN 
<213> Human 

<400> 3 

atgcgcagca gcggcgccga cgcggggcgg tgcctggtga ccgcgcgcgc tcccggaagt 60 
gtgccggcgt cgcgcgaagg ttcagcaggg agccgtgggc cgggcgcgcc ggttcccggc 120 
acgtgtctcg gcacgtggca gcgcgcctgg ccctgggctt ggaggcgccg gcgccctgga 180 
tccgccggcc gtggtcgccg agtcggtgtc gtccttgacc atcgccgacg cgttcattgc 240 
agccggcgag agctcagctc cgaccccgcc gcgccccgcg cttcccagga ggttcatctg 300 
ctccttccct gactgcagcg ccaattacag caaagcctgg aagcttgacg cgcacctgtg 360 
caagcacacg ggggagagac catttgtttg tgactatgaa gggtgtggca aggccttcat 420 
cagggactac catctgagcc gccacattct gactcacaca ggagaaaagc cgtttgtttg 480 
tgcagccact ggctgtgatc aaaaattcaa cacaaaatca aacttgaaga aacattttga 540 



# 
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fccudk ****** 

acgcaaacat gaaaatcaac aaaaacaata tatatgcagt tttgaagact gtaagaagac 600~" 
ctttaagaaa catcagcagc tgaaaatcca tcagtgccag cataccaatg aacctctatt 660 
caagtgtacc caggaaggat gtgggaaaca ctttgcatca cccagcaagc tgaaacgaca 720 
tgccaaggcc cacgagggct atgtatgtca aaaaggatgt tcctttgtgg caaaaacatg 780 
gacggaactt ctgaaacatg tgagagaaac ccataaagag gaaatactat gtgaagtatg 840 
ccggaaaaca tttaaacgca aagattacct taagcaacac atgaaaactc atgccccaga 900 
aagggatgta tgtcgctgtc caagagaagg ctgtggaaga acctatacta ctgtgtttaa 960 
tctccaaagc catatcctct ccttccatga ggaaagccgc ccttttgtgt gtgaacatgc 1020 
tggctgtggc aaaacatttg caatgaaaca aagtctcact aggcatgctg ttgtacatga 1080 
tcctgacaag aagaaaatga agctcaaagt caaaaaatct cgtgaaaaac ggagtttggc 1140 
ctctcatctc agtggatata tccctcccaa aaggaaacaa gggcaaggct tatctttgtg 12 00 
tcaaaacgga gagtcaccca actgtgtgga agacaagatg ctctcgacag ttgcagtact 1260 
tacccttggc taa 

<210> 4 
<211> 1213 
<212> ADM 
<213> Human 

<400> 4 

gtgccggcgc cgcgcgaagg ttcagcaggg agccgtgggc cgggcgcgcc ggttcccggc 60 
acgtgtctcg gcacgtggca gcgcgcctgg ccctgggctt ggaggcgccg gcgccctgga 12 0 
tccgccggcc gtggtcgccg agtcggtgtc gtccttgacc atcgccgacg cgttcattgc 180 
agccggcgag agctcagctc cgaccccgcc gcgccccgcg cttcccagga ggttcatctg 240 
ctccttccct gactgcagcg ccaattacag caaagcctgg aagcttgacg cgcacctgtg 300 
caagcacacg ggggagagac catttgtttg tgactatgaa gggtgtggca aggccttcat 360 
cagggactac catctgagcc gccacattct gactcacaca ggagaaaagc cgtttgtttg 420 
tgcagccact ggctgtgatc aaaaattcaa cacaaaatca aacttgaaga aacattttga 480 
acgcaaacat gaaaatcaac aaaaacaata tatatgcagt tttgaagact gtaagaagac 540 
ctttaagaaa catcagcagc tgaaaatcca tcagtgccag cataccaatg aacctctatt 600 
caagtgtacc caggaaggat gtgggaaaca ctttgcatca cccagcaagc tgaaacgaca 660 
tgccaaggcc cacgagggct atgtatgtca aaaaggatgt tcctttgtgg caaaaacatg 720 



13/14 teuSKe tecriftfe 



gacggaactt ctgaaacatg tgagagaaac ccataaagag gaaatactat gtgaagtatg 78 0 
ccggaaaaca tttaaacgca aagattacct taagcaacac atgaaaactc atgccccaga 840 
aagggatgta tgtcgctgtc caagagaagg ctgtggaaga acctatacta ctgtgtttaa 900 
tctccaaagc catatcctct ccttccatga ggaaagccgc ccttttgtgt gtgaacatgc 960 
tggctgtggc aaaacatttg caatgaaaca aagtctcact aggcatgctg ttgtacatga 1020 
tcctgacaag aagaaaatga agctcaaagt caaaaaatct cgtgaaaaac ggagtttggc 1080 
ctctcatctc agtggatata tccctcccaa aaggaaacaa gggcaaggct tatctttgtg 1140 
tcaaaacgga gagtcaccca actgtgtgga agacaagatg ctctcgacag ttgcagtact 1200 
tacccttggc taa 121 -? 



<210> 5 
<211> 34 
<212> ADN 
<213> Human 

<400> 5 

cggggtacca aaaatgcgca gcagcggcgc cgac 

<210> 6 
<211> 21 
<212> ADN 
<213> Human 



34 



<400> 6 

tccttccctg actgcagcgc c 

<210> 7 
<211> 20 
<212> ADN 
<213> Human 

<400> 7 

tgcacaggtg cgcgtcaagc 

<210> 8 
<211> 20 
<212> ADN 
<213> Human 

<400> 8 

cacaaacaaa tggtctctcc 



<210> 9 
<211> 30 




• 



rectify 
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<212> ADN 
<213> Human 

<400> 9 

cggtctagat tagccaaggg taagtactgc 

<210> 10 
<211> 30 
<212> ADN 
<213> Human 

<400> 10 

cctcccgggg ccaagggtaa gtactgcaac 



THIS PAGE BLANK (us«™> 



